复旦MOSS团队接受访谈:它就像一个“聪明的小孩”

2023-03-02 12:09:55 来源:网络

图说:MOSS

图说:MOSS

由美国OpenAI公司开发的ChatGPT模型在全球点燃了新一轮AI革命,海内外关注度陡增。前不久,复旦大学计算机科学技术学院邱锡鹏团队发布类ChatGPT模型MOSS,新闻迅速登上微博热搜。近日,邱锡鹏团队接受了访谈,详细介绍了人们关注的MOSS。

大家最兴奋的一天,是春节前的腊月二十八。项目主开发者、计算机科学技术学院博士研究生孙天祥,在测试过程中输入了一个中文问题,MOSS却以英文正确回答,“就像一个不会说但听得懂中文的人”。当时版本的MOSS还很初级,中文语料占所有训练数据不到0.1%。

“很神奇,我们没有教过它机器翻译。”MOSS显示出的潜能让邱锡鹏当晚激动到失眠。他把MOSS比作一个“聪明的小孩”,即便现在还不擅长写诗、解题或很多具体的事,但已展示出成为通用人工智能(AGI)大框架的潜能,“很多遥不可及的事情,它一点就通了。”实际上,邱锡鹏也让6岁的女儿和MOSS聊天,发现孩子可以愉快地和MOSS对话很长时间。

MOSS受到关注的背后,是科研人员十年如一日的积淀。作为一名人工智能研究专家,邱锡鹏从读博期间就开始涉猎机器学习,留校工作后进入自然语言处理研究领域。他和团队在自然语言处理的基础模型和基础算法上形成了很多创新的研究成果。邱锡鹏的著作《神经网络与深度学习》被广大读者亲切称为“蒲公英书”,在许多“人工智能必看书单”中榜上有名。去年,他还带领团队获得了中国中文信息学会“钱伟长中文信息处理科学技术奖”一等奖。

这些天,邱锡鹏与他的MOSS团队——8位年轻的复旦学生,继续紧锣密鼓地开展内测和迭代工作。新模型预计在3月底优化完成,后期再逐步对社会开放。

目前已参与内测的一些用户表示,尽管MOSS在参数规模上和ChatGPT相比小一个量级,事实性问题覆盖不够全面,经常会“一本正经地胡说八道”,但确实有“ChatGPT那味儿”“基本功能都实现了”。邱锡鹏很乐观,认为在不远的将来,MOSS这类大型语言模型会成为和搜索引擎一样常规的存在,为人们生活的方方面面提供助益。

邱锡鹏介绍,ChatGPT的参数量多达1750亿个,而MOSS的参数量比其小一个数量级,大约是前者的1/10。“比起事实类的知识储备,模型的逻辑思维能力更值得大家关注”,有一种说法,说我们和国外的技术水平差距非常大,想追上的话,要花很长时间。但我们的努力证明,其实不需要那么久。

新民晚报记者 张炯强 通讯员 殷梦昊 许文嫣

【相关报道】

MOSS究竟是什么?邱锡鹏答记者问,回应社会关注热点。

图说:团队照片,左六为邱锡鹏

图说:团队照片,左六为邱锡鹏

记者:可否简单介绍一下MOSS?这种“大型对话式语言模型”和我们日常使用的Siri、小度、小爱等聊天机器人有什么区别?

邱锡鹏:我可以打个比方,这两者的关系就像智能手机和功能手机。之前的聊天系统还属于弱人工智能,设计它们就是用来聊天的,就像传统的功能手机只能用来打电话;而现在的大型语言模型,像ChatGPT、MOSS,它们能做很多事,聊天只是功能之一,就像智能手机可以用来打电话,但它的功能远远不止于此。

就ChatGPT、MOSS而言,它们具备的是一种通用能力,可以帮助人类完成各种各样的事情,只不过以对话形式呈现。它可以完成自然语言处理领域的绝大部分任务,包括机器翻译、信息抽取、纠错等。它们还可以在学习使用外部工具后,与外部世界进行交互,进行创作。这些都是现有的聊天机器人所不具备的。应该说,这种对话式大型语言模型向我们展示了一条通向“通用人工智能”的崭新路径。

记者:团队2月20日发布了MOSS模型,是刚刚建成吗?前后花了多长时间?

邱锡鹏:事实上,我们在春节前就开发出了第一代模型。它显示出了很大的潜能,与之前的聊天系统大不相同,有着不错的人类意图理解能力,也有很多涌现能力,比如未经训练就学会了机器翻译。之后,我们又花了一个多月的时间打磨它的工程部署情况,比如提高效率、优化界面等。

MOSS的开发同样不是一蹴而就,它离不开我们团队过去的铺垫工作和长期积累的研究经验。从2021年起,我们就开始做中文生成式预训练模型,也开源供别人下载,每月平均有上万次下载。后面我们又提出“语言模型即服务”的概念,认为基础语言模型会成为语言服务的基座。因为意识到大型语言模型会成为将来的基座,所以去年开始做大型语言模型方面的训练。后来又花费了半年时间,研究如何使大型语言模型理解人类指令以及具备对话能力。

记者:MOSS如何能够实现“端到端”走通大语言模型,克服了哪些难点?

邱锡鹏:“端到端”是一个学术概念,指的是从零开始,信息收集、数据处理、建立模型,到最终形成一个具有和人类对话能力的大模型,中间所有技术路径可以走通,这个就叫由起点到终点的“端到端”。因为OpenAI至今没有公布开发ChatGPT的技术路线和技术细节,所以我们需要靠有限的公开信息来自己摸索。

这个过程非常难,包含了非常多经验性、直觉性的设计,关键要打通两步:第一是基座,大型语言模型的基座不是简单的参数足够大就可以,还需要赋予大型语言模型各种各样的知识能力、学习能力,还有逻辑推理能力。第二就是要通过一些指令触发它的对话能力,让它理解人类意图,与人类能够交互对话。

到目前为止,我们还能把控技术路线,但未来可能会面临更大的困难,因为我们收集了非常多和人类交互的指令,要赋予它价值观和各种各样的能力,就要请一些专业人士来帮助我们设计,进一步增强MOSS各方面的能力。

记者:MOSS的名字是怎么来的?

邱锡鹏:在学术圈,大家非常喜欢用影视形象给自己开发的AI模型命名,也是一个比较常见的做法。比如,Transformer模型、Megatron模型名称取自《变形金刚》,BERT模型、ERNIE模型化用了《芝麻街》中的角色形象。那么,我们开发出这个具有对话能力的大型语言模型之后,也想找一个国产的、能够代表中国特色的影视形象来命名。

开发过程中,正逢《流浪地球2》电影热映,我们的团队成员都非常喜欢《流浪地球2》,也都是《流浪地球2》的粉丝。影片中的智能量子计算机MOSS给我们留下了深刻的印象,所以我们就把模型命名为MOSS,也是向《流浪地球2》这部电影致敬。这几天也有《流浪地球2》的粉丝们给我们发邮件,希望我们一定要加油,真的能够做出来。

新民晚报记者 张炯强 通讯员 殷梦昊 许文嫣

,复旦MOSS团银手镯 队接受访谈:它就像一个“聪明的小孩”

相关:

连牲口都活不下去了三年前,蔚来股价跌到1块多、亮起退市红线时,李斌尝试去抱过很多大腿。从北京亦庄国投,浙江湖州政府,到广汽、吉利、上汽……不过每个传闻里的大腿,他都没抱上。压力最大的时候,他在香港等了两天,才等来他一直想等的人:爱马仕哥。姗姗来迟的爱马仕哥,请了李斌吃了一顿大餐。吃到最后,被贾会计骗过一次的爱马仕哥,还是决定不投蔚来,而是自己继续干恒大汽车。大大大、圈圈圈、好好好……从香港回来,李斌抱上了合肥的大..

TikTok开始与苹果谈判 确保美数据安全计划不受应用商店阻碍TikTok CEO周受资凤凰网科技讯 北京时间3月2日消息,目前,热门短视频应用TikTok在美国面临被禁的风险。知情人士称,要想消除美国政府对于数据安全的担忧,TikTok还要克服一个潜在障碍,那就是苹果和谷歌的应用商店规则。知情人士称,TikTok已开始与苹果、谷歌进行谈判,以确保其拟议的数据安全计划不会因苹果和谷歌的应用商店规定而失败。根据TikTok向美国政府提出的计划,TikTok应用的每一次更新都将经过甲骨文的审查并由其..

如果TikTok被禁,哪些美国公司会成为“受益者”?TikTok凤凰网科技讯 北京时间3月2日消息,美国众议院外交委员会周三通过了一项法案,朝着在美封禁TikTok的方向前进。如果这款热门短视频应用被禁,那么其美国社交媒体对手谷歌旗下YouTube、脸书、Snap将会受益匪浅。投行尼德汉姆公司分析师劳拉·马丁(Laura Martin)在接受采访时表示,“对于任何一个市场份额被TikTok抢走的公司来说,(禁令的)影响都是巨大的”。她指出,如果禁令最终生效,谷歌旗下YouTube、Meta旗下脸书以及S..

39天,26名医院领导落马,医疗反腐来了医院院长不能一“长”独大2月17日,四川省德阳市纪委监委官网发布消息称,绵竹市中医医院党委书记李锐被查。履历显示,李锐现年55岁,在该医院做过11年院长。同日,该官网还称,德阳市第二人民医院党委副书记、院长张德军被查。近年来,医院领导被查的新闻屡见不鲜。如收受100套楼房、100个车位,总受贿超1.1亿元的云南省第一人民医院原院长王天朝;妄图通过“政治骗子”疏通关系逃避调查,医商勾结的江西省赣南医学院第三临床医..

为什么队长反对全面取消罪犯子女考公限制?全国政协委员周世虹建议,消除对罪犯子女考公的限制。对于该提议,队长表示要旗帜鲜明地反对。这就像队长坚决反对,取消死刑一样。大家都知道,要想进入国家队伍,是要经过政审考察的。如果父母有犯罪记录,子女在考公时,会面临很大的政审阻力。假设三个人一起通过公务员笔试,去参加面试。其中一人不仅成绩位列第一,且面试表现优越,但若是政审不合格,一般单位会拒绝对该考生的录用,转而选择替补的第二名。不仅是考公,在入..

重庆一父亲为自闭症孩子造蒸汽火车重庆市永川区老鹰岩。航航家的墙上贴有很多张铅笔画的小火车,稚嫩的线条里,装载的是这个15岁自闭症少年对火车的喜爱和渴望。李家伟特别爱看儿子一笔一画地认真勾勒出火车的形状。就如同航航特别珍爱爸爸耗费十多年时间,亲手为他做出的一辆辆微缩版蒸汽式火车。他可以驾驶着火车,拉响汽笛,伴随着“哐、哐、哐”的声响,驰骋在洒满阳光的铁轨上。爸爸为他铺设的铁路坚固牢实,似乎可以一直延伸到全世界。1、 承诺为儿子打造..

男子网购2斤瓜子装7两干燥剂,网友:干燥剂比瓜子便宜3月1日,吉林延边。金先生收到网购的2斤瓜子,结果4袋瓜子中,每袋含有一个重达90多克的干燥剂,4包瓜子中干燥剂就有7两多,瓜子净重不到1.3斤。金先生称,自己没联系商家,都是做买卖的,没那个必要。自动播放

不要让“雷人提案”影响全国两会的严肃性1)全国人大代表依法履行职责,全国政协委员积极参政议政,这是中国特色社会主义民主政治的重要内容。全国人大代表在提出议案、全国政协委员在提出提案时,应坚持建设性与科学性并举的原则,并充分考虑可行性,不能“天马行空”,更不能“语不惊人死不休”。要避免提案、议案“娱乐化”,更不能让“雷人雷语”影响了全国两会的严肃性。2)全国人大代表和全国政协委员来自人民,也应该接受人民群众的监督。人民群众对全国人大代表..

歼-35隐形舰载机官宣后,完整版福建舰航母战力有多强解放军海军官方账号“人民海军”2月27日发布了2023年招收舰载机飞行学员的宣传片。在视频的片尾,一架明显与旁边歼-15不同的战斗机出现在机场跑道上。尽管画面经过虚化处理,但从轮廓来看这是一架隐形舰载机,与之前外媒频繁报道的歼-35相似度很高——中国海军的隐形舰载战斗机项目已经是板上钉钉了。海军招飞宣传片中的隐形舰载机海军官方宣传片中的这个彩蛋,不但意味着解放军海军航空兵可能即将接收隐形舰载战斗机,甚至不能..

全国人大代表、全国政协委员是如何产生的春风浩荡,两会时间即将开启。相信即将召开的全国两会,一定是不少人近期最为关注的话题之一。2月24日,十三届全国人大常委会第三十九次会议表决通过关于十四届全国人大代表的代表资格的审查报告,确认2977名代表的代表资格有效。随后,全国人大常委会发表公告,公布十四届全国人大代表名单。全国人大常委会办公厅关于第十四届全国人民代表大会代表选举工作情况的报告显示,2022年12月中旬至2023年1月,在全国人大常委会主持下,..