比ChatGPT更早发布的微信大语言模型,现在什么水平?

2023-03-04 00:15:03 来源:网络

ChatGPT 的出现让 AI 技术一跃成为了科技圈的当红炸子鸡。

几乎万能的 ChatGPT 让写邮件、拟合同等重复性工作失去了意义,对于写代码、写小说、写 PPT 等工作它更是信手拈来。

但讨论 ChatGPT 能做什么、能取代些什么等话题已经过时了,现在人们更想要知道下一个「ChatGPT」在哪?

微软的新 Bing?现在排队可能要排到天荒地老。

百度的文心一言?目前似乎「文」字还没一撇。

Google 的 Bard?这更是一个未知数。

难道现在除了 ChatGPT 以外,就没有懂得聊天的机器人了吗?

先别急,什么都懂一点的微信不会轻易得让你失望。

在去年 10 月微信低调发布了一个名为 WeLM 语言模型,当时微信对 WeLM 的定义只是一个能「唠嗑」的 AI。

现在回看,WeLM「唠嗑」的能力已经能满足我们对文本生成式 AI 的期待。

不过微信强调 WeLM 并不是聊天机器人,而是一个补全用户输入信息的生成模型。

根据微信反馈的消息,WeLM 只是微信内部的创新型实验项目,没有计划应用到实际的产品之中,也不会与微信 app 的体验有所关联,未来 WeLM 有可能会不定时下架。

八项全能

WeLM 能做什么呢?

先给它出个关于阿房宫问题,看看它的知识储备量。

似乎回答得没什么毛病,再看看它对二次元了解多少。

看来一些基本的二次元常识对 WeLM 来说还是过于简单了。

既然常识知识问不倒他,那么问点最新资讯看看 WeLM 能不能回答得上来。

当我问到它知不知道 ChatGPT 时,WeLM 的回答开始出现错误,答案和事实偏差十万八千里。

再问问一些特别细节的问题,例如《可爱女人》的第一句歌词是什么?

▲ 可爱女人坐船头是什么异次元混搭……

▲ 可爱女人坐船头是什么异次元混搭……

WeLM 的表现也不能令人满意。

这也是 WeLM 的局限性所在。根据微信团队给出的说明,WeLM 并不是一个直接对话的机器人,而是一个补全用户输入信息的生成模型。

WeLM 全称为 Well-Read Language Model,最大的模型版本的训练参数达 100 亿,它的强项在于中文理解和生成能力,能够在在零样本或少样本的情境下完成多种 NLP 任务(包括多语言任务)。

根据官方给出的提问教程,WeLM 的回答问题的侧重点应该是在「补全句子」上。

例如在「给猫取名字」的例子上,提问者需要先给 WeLM 举出一些例子,再让 WeLM 来补全。

也许是测试版本的原因,目前 WeLM 补全答案时的发散性似乎要大于准确性,因此你会发现 WeLM 什么都能答上来,但是回答得不一定准。

对于它的一些「胡言乱语」,只能说大家笑一笑就好。

这种补全内容的回答机制可以诞生出各种各样的玩法,微信官方为此提供了「对话、文案生成、文本改写、阅读理解、翻译、文章续写、自由任务」共八种模式。

先来试试商品文案生成,我用它为制糖工厂的硬糖充电头生成了一段商品文案,前半段看起来还像模像样的,但写到后面的商品描述时似乎 CPU 就过载了。

不得不说,最后一句「一种只为爱的甜蜜味道」还有点耐人寻味的意思。

再来试试翻译,这可是微信的强项。

我用它翻译了一段 OpenAI 对 ChatGPT 的介绍,WeLM 轻松完成了任务。

根据官方的介绍,WeLM 不仅能完成多种语言间的翻译,还能翻译同时夹杂着多种语言文段。

例如这段同时包含中文、英文、日文的复杂语句,WeLM 就能完整地翻译出来。

当你在看像公司财报那样又长又复杂的文章时,可以将它复制到 WeLM 里,用「阅读理解」直接检索出想要的信息。

不过 WeLM 的理解能力还比较表面,它基本上只能回答出能在文章中直接检索到信息,如果你想基于苹果 2022 年的营收额和增长率,问它苹果 2021 的营收额是多少,这种拐个弯的问题它就不能计算出来。

或者说,你需要用更精准的提示词(prompt)指令才有可能让它答出。

WeLM 的对话功能是一个可玩性挺高的功能,你可以通过一系列的提示词为 WeLM 设立人设(变成李白、变成乔布斯、变成马斯克),实现一场跨越时空的对话。

我试着让 WeLM 扮演的李白评价一下杜甫,「李白」评价道读杜甫的诗就像饮下一壶美酒,还引用了杜甫的《哀江头》。

《哀江头》作于至德二年(757 年),而李白逝世于宝应元年(762 年),没准李白生前还真的读过杜甫的《哀江头》。

你还可以让 WeLM 扮演马斯克,让它评价一下特斯拉、Twitter、自动驾驶等问题,甚至可以采访它对于李白的看法。

WeLM 是怎么做到的?

一番体验过后,我明显感觉到 WeLM 对于精准提示词的依赖性要高于 ChatGPT。

虽然两者都有很强的自然语言理解能力和表达能力,但 WeLM 的学习成本和使用成本要更高,在让 WeLM 回答问题之前你需要先给它讲清楚回答问题的逻辑(举例回答),提示词也要不断地打磨,最终才会得到你想要的答案。

相比之下,ChatGPT 是一个平易近人的隐士,进可高山流水,退可下里巴人。无论是简单的问句、文章总结,还是复杂的编程问题,ChatGPT 基本上都能一并解答。

▲ 图片来自:微信 AI

▲ 图片来自:微信 AI

这当然也和两者的模型算法、训练参数量有关,WeLM 的一大优势在于它是采用多样化和广泛的中文网页、书籍、新闻、论坛和学术论文数据集进行训练,对于中文的理解能力会更加突出。

WeLM 的学习数据来源主要从 Common Crawl 下载的近两年的中文网页数据,除此之外还包括大量的书籍、新闻、论坛数据和学术论文等,总数据量为 10 TB。

▲ 图片来自:微信 AI

▲ 图片来自:微信 AI

抛开 ChatGPT 这样的尖子生不谈,WeLM 在和 CPM、华为 Pangu、百度 Ernie 3.0(文心一言前身)等同级别模型对比时,在 14 项 NLP 任务上 WeLM 基本上都能实现领先。

可惜的是,这只是微信的一次实验性尝试,在未来有可能会不定时下架,短期内我们应该也很难在微信上见到类似的智能聊天功能,本文仅作为功能体验分享。

,比ChatGPT更早易考网 发布的微信大语言模型,现在什么水平?

相关:

爱耳日:如何“拯救”1.2亿听力障碍银发族?3月3日第二十四次全国爱耳日到来。如这个节日的存在感一样,生活中听力不好的老年人随处可见,可大众对此大多不以为意。“年纪大了,听不清楚很正常”、“听不到就少聊天呗”、“听不到反而更安静,省心省事”。不仅未受过“听力障碍”困扰的年轻人这么想,很多老年人也忽视了“听不清”“听不到”的危害性。作为全球人口第一大国和中度老龄化大国,中国身患老年听力障碍慢性疾病的人数规模已非常可怕,中国老年听障群体规模达到..

脑洞大开!科学家想用气球“撬动”太阳 阻止全球变暖【CNMO新闻】去年9月,英国的研究人员发射了一个高空气象气球,向平流层释放了几百克二氧化硫。这被视为太阳地球工程领域第一个正式的科学研究实践。据了解,该项目的全称为“平流层气溶胶运输和成核”(Stratospheric Aerosol Transport and Nucleation,缩写为SATAN),这是一套成本不到1000美元的气球系统,但能够“撬动”太阳。啥是太阳地球工程?它的目的是通过偏转原本会照射到地球的阳光来冷却地球,以阻止全球变暖,..

“终生质保”,奇瑞葫芦里卖什么药?在万物复苏的季节里,有别于大多数行业的“缓慢回血”,国内汽车行业再次卷出了新高度。近日,奇瑞正式官宣“全系整车终身质保”,瞬间引发了人们的关注。奇瑞公开信息显示,自2023年1月1日起,凡购买奇瑞集团旗下星途、奇瑞、捷途和奇瑞新能源四大品牌的全系车型,均可享受“终生质保”的购车政策。自此,奇瑞成为国内首个继推出“发动机终生质保”后,又推出“全系车型整车终身质保”的自主品牌。图 / 奇瑞控股官网当然,对..

疑似一小鹏P7自燃起火 旁边一辆特斯拉在观望夏季将至,汽车也到了自燃高发季。日前,网友上传视频显示,疑似一辆小鹏P7电动车,在路边发生起火事故,现场火势异常凶猛,一旁有人员拿着灭火器向起火车辆跑去,准备紧急灭火。但从火势来看,普通的灭火器已经起不了太大作用,整车已经完全被大火包围。而距离起火车辆不远,还有一辆特斯拉在观望。目前,针对此次起火事故,小鹏汽车方面还没有做出相关情况说明。而在去年7月份,上海街头一辆小鹏P7当街自燃起火,大火将整车燃..

特斯拉没“招”了?极派Daily(ID:rancaijingapp)原创作者 | 吕敬之编辑 | 饶霞飞“故事大王”马斯克这次似乎没新故事可讲了。北京时间3月2日凌晨5点,特斯拉(TSLA.US)投资者日开始了同步直播。无数马斯克和特斯拉的粉丝定好闹钟,打开了直播间,但他们不知道的是,自己将经历一场冗长、无聊、令人失望的发布会。“这或许是我看过马斯克最无聊的演讲了。我印象中,马斯克永远是机智,甚至带着些诡辩魅力的。这场发布会,特斯拉团队花了大量..

理想你这样抄试卷,蔚来知道吗?图片来源@视觉中国文 | 雷科技Ieitech我,蔚来,造车新势力三大巨头之一,看到现在的汽车行业,只想重复古人的一句话“历史是个圈”。汽车行业发展百余年,某些东西似乎要回到189年前的状态,而曾我那曾被一众车企看不上的方案,终于要被其他车企学习和效仿。在寒冷冬季的街头,开着挂着绿牌的电动汽车,看着充满电后预计里程不足200公里的续航,此时你是否希望,能够有人发明一种液体,加入到汽车之中,就可以让汽车跑几百公..

福特成立全资子公司LATITUDE AI:开发自动驾驶技术随着汽车逐渐智能化,各大汽车厂商都在前仆后继地研究自动驾驶技术。自动驾驶对智能汽车来说非常重要,未来,谁能先掌握自动驾驶技术谁就能在激烈的竞争中获得优势。日前,福特汽车公司宣布成立了一家全资子公司Latitude AI,该公司将专注于开发一种无需手握方向盘、视线可以脱离路面的主动驾驶辅助系统。Latitude随着Latitude的成立,福特将增加由一支机器学习、机器人技术、软件开发、传感器技术、系统工程和测试和安全操作等..

理想CEO李想:理想不降价作者|于惠如 编辑|罗丽娟3月2日的理想汽车春季媒体分享会上,理想汽车创始人、董事长兼CEO李想用近两小时的时间,详细回答了“理想是谁?经营理念是什么?接下来怎么做?”等问题。李想表示,过去7年半时间,理想已经实现了“从0到1”,进入了“从1到10”的阶段。在“从0到1”的阶段,理想依靠一款理想one做到了百亿美金的收入。2022年,新能源车市场出现拐点。这一年,新能源乘用车渗透率突破27%,销量近650万辆。这一年,在..

訚柏已任中央政法委委员、秘书长“中央政法委长安剑”微信公众号消息,3月3日,中央政法委委员、秘书长訚柏赴执法监督局、政法综治信息中心、长安杂志社、中国长安出版传媒有限公司等委直属单位和中华见义勇为基金会调研指导工作。上述消息显示,訚柏已经担任中央政法委委员、秘书长。訚柏简历:公开资料显示,訚柏出生于1969年,拥有博士研究生学历,中共党员,1991年7月参加工作。訚柏曾任过云南省楚雄州中院院长、昆明市中院院长、云南省委政法委员会副书记..

中央政法委秘书长訚柏赴直属单位调研指导工作3月3日,中央政法委委员、秘书长訚柏赴执法监督局、政法综治信息中心、长安杂志社、中国长安出版传媒有限公司等委直属单位和中华见义勇为基金会调研指导工作。他强调,要坚持以习近平新时代中国特色社会主义思想为指导,深入学习贯彻党的二十大和二十届一中、二中全会精神,认真贯彻落实中央政法工作会议部署要求,提高政治站位、勇于开拓创新,为奋力推进政法工作现代化贡献力量。调研中,訚柏充分肯定各单位近年来工作,勉励干..