比 ChatGPT 更早发布的微信大语言模型,现在什么水平?

2023-03-03 20:16:01 来源:网络

ChatGPT 的出现让 AI 技术一跃成为了科技圈的当红炸子鸡。

几乎万能的 ChatGPT 让写邮件、拟合同等重复性工作失去了意义,对于写代码、写小说、写 PPT 等工作它更是信手拈来。

但讨论 ChatGPT 能做什么、能取代些什么等话题已经过时了,现在人们更想要知道下一个「ChatGPT」在哪?

微软的新 Bing?现在排队可能要排到天荒地老。

百度的文心一言?目前似乎「文」字还没一撇。

Google 的 Bard?这更是一个未知数。

难道现在除了 ChatGPT 以外,就没有懂得聊天的机器人了吗?

先别急,什么都懂一点的微信不会轻易得让你失望。

在去年 10 月微信低调发布了一个名为 WeLM 语言模型,当时微信对 WeLM 的定义只是一个能「唠嗑」的 AI。

现在回看,WeLM「唠嗑」的能力已经能满足我们对文本生成式 AI 的期待。

不过微信强调 WeLM 并不是聊天机器人,而是一个补全用户输入信息的生成模型。

根据微信反馈的消息,WeLM 只是微信内部的创新型实验项目,没有计划应用到实际的产品之中,也不会与微信 app 的体验有所关联,未来 WeLM 有可能会不定时下架。

八项全能

WeLM 能做什么呢?

先给它出个关于阿房宫问题,看看它的知识储备量。

似乎回答得没什么毛病,再看看它对二次元了解多少。

看来一些基本的二次元常识对 WeLM 来说还是过于简单了。

既然常识知识问不倒他,那么问点最新资讯看看 WeLM 能不能回答得上来。

当我问到它知不知道 ChatGPT 时,WeLM 的回答开始出现错误,答案和事实偏差十万八千里。

再问问一些特别细节的问题,例如《可爱女人》的第一句歌词是什么?

▲ 可爱女人坐船头是什么异次元混搭……

WeLM 的表现也不能令人满意。

这也是 WeLM 的局限性所在。根据微信团队给出的说明,WeLM 并不是一个直接对话的机器人,而是一个补全用户输入信息的生成模型。

WeLM 全称为 Well-Read Language Model,最大的模型版本的训练参数达 100 亿,它的强项在于中文理解和生成能力,能够在在零样本或少样本的情境下完成多种 NLP 任务(包括多语言任务)。

根据官方给出的提问教程,WeLM 的回答问题的侧重点应该是在「补全句子」上。

例如在「给猫取名字」的例子上,提问者需要先给 WeLM 举出一些例子,再让 WeLM 来补全。

也许是测试版本的原因,目前 WeLM 补全答案时的发散性似乎要大于准确性,因此你会发现 WeLM 什么都能答上来,但是回答得不一定准。

对于它的一些「胡言乱语」,只能说大家笑一笑就好。

这种补全内容的回答机制可以诞生出各种各样的玩法,微信官方为此提供了「对话、文案生成、文本改写、阅读理解、翻译、文章续写、自由任务」共八种模式。

先来试试商品文案生成,我用它为制糖工厂的硬糖充电头生成了一段商品文案,前半段看起来还像模像样的,但写到后面的商品描述时似乎 CPU 就过载了。

不得不说,最后一句「一种只为爱的甜蜜味道」还有点耐人寻味的意思。

再来试试翻译,这可是微信的强项。

我用它翻译了一段 OpenAI 对 ChatGPT 的介绍,WeLM 轻松完成了任务。

根据官方的介绍,WeLM 不仅能完成多种语言间的翻译,还能翻译同时夹杂着多种语言文段。

例如这段同时包含中文、英文、日文的复杂语句,WeLM 就能完整地翻译出来。

当你在看像公司财报那样又长又复杂的文章时,可以将它复制到 WeLM 里,用「阅读理解」直接检索出想要的信息。

不过 WeLM 的理解能力还比较表面,它基本上只能回答出能在文章中直接检索到信息,如果你想基于苹果 2022 年的营收额和增长率,问它苹果 2021 的营收额是多少,这种拐个弯的问题它就不能计算出来。

或者说,你需要用更精准的提示词(prompt)指令才有可能让它答出。

WeLM 的对话功能是一个可玩性挺高的功能,你可以通过一系列的提示词为 WeLM 设立人设(变成李白、变成乔布斯、变成马斯克),实现一场跨越时空的对话。

我试着让 WeLM 扮演的李白评价一下杜甫,「李白」评价道读杜甫的诗就像饮下一壶美酒,还引用了杜甫的《哀江头》。

《哀江头》作于至德二年(757 年),而李白逝世于宝应元年(762 年),没准李白生前还真的读过杜甫的《哀江头》。

你还可以让 WeLM 扮演马斯克,让它评价一下特斯拉、Twitter、自动驾驶等问题,甚至可以采访它对于李白的看法。

WeLM 是怎么做到的?

一番体验过后,我明显感觉到 WeLM 对于精准提示词的依赖性要高于 ChatGPT。

虽然两者都有很强的自然语言理解能力和表达能力,但 WeLM 的学习成本和使用成本要更高,在让 WeLM 回答问题之前你需要先给它讲清楚回答问题的逻辑(举例回答),提示词也要不断地打磨,最终才会得到你想要的答案。

相比之下,ChatGPT 是一个平易近人的隐士,进可高山流水,退可下里巴人。无论是简单的问句、文章总结,还是复杂的编程问题,ChatGPT 基本上都能一并解答。

▲ 图片来自:微信 AI

这当然也和两者的模型算法、训练参数量有关,WeLM 的一大优势在于它是采用多样化和广泛的中文网页、书籍、新闻、论坛和学术论文数据集进行训练,对于中文的理解能力会更加突出。

WeLM 的学习数据来源主要从 Common Crawl 下载的近两年的中文网页数据,除此之外还包括大量的书籍、新闻、论坛数据和学术论文等,总数据量为 10 TB。

▲ 图片来自:微信 AI

抛开 ChatGPT 这样的尖子生不谈,WeLM 在和 CPM、华为 Pangu、百度 Ernie 3.0(文心一言前身)等同级别模型对比时,在 14 项 NLP 任务上 WeLM 基本上都能实现领先。

可惜的是,这只是微信的一次实验性尝试,在未来有可能会不定时下架,短期内我们应该也很难在微信上见到类似的智能聊天功能,本文仅作为功能体验分享。

,比 ChatGPT 更早疫情下的中国 发布的微信大语言模型,现在什么水平?

相关:

OpenAI 首席技术官 Mira Murati:AI 技术应该以人类为中心Mira Murati 是一位在科技行业备受瞩目的人物,拥有广泛的学术和实践经验。她曾在谷歌和微软等知名科技公司担任高管,并且拥有多年的机器学习和人工智能经验。现在,作为 OpenAI 的首席技术官,Mira Murati 在推动人工智能的发展方面发挥了重要作用。她非常关注人工智能的安全性和透明度,倡导开放源代码的人工智能研究,并且鼓励女性在科技领域发展。在这篇文章里,我们将更深入地了解 Mira Murati 的背景和经历,探讨..

上机数控:签订晶硅片等销售长单合同 金额合计136亿元集微网消息,3月2日晚间,上机数控公告两笔长单销售合同,涉及单晶硅片与单晶方棒,金额合计达136.19亿元。上机数控表示,无锡上机数控股份有限公司(以下简称“公司”或“本公司”)下属全资子公司弘元新材料(包头)有限公司(以下简称“弘元新材”)与江苏新潮光伏能源发展有限公司(以下简称“江苏新潮”)就“单晶硅片”的销售签订合同。对方自2023年3月至2026年2月总计向公司采购单晶硅片13.25亿片(上下浮动不超过20%),..

机械硬盘彻底没得玩了!300TB SSD 2026年见机械硬盘虽然短期内不会被完全淘汰,但其技术、容量发展如此之慢,在SSD面前真的是完全不够看。全闪存存储供应商Pure Storage预计,其独有的DFM(直接闪存模组) SSD的容量将在三年内增长6倍,达到300TB之多。Pure Storage目前出货的DFM SSD最大容量为48TB,未来几年会不断提升容量,甩开竞争对手,预计最快在2026年就做到300TB,甚至有希望在2025年提前达成。提升闪存容量最有效的方法就是堆叠更多的层数,目前普遍做到了112-..

小米Redmi Watch 3 Lite智能手表实物照片曝光IT之家 3 月 3 日消息,型号为“M2247W1”的 Redmi Watch 3 Lite 智能手表日前通过 EEC 机构认证之后,于近日再次现身韩国国家无线电研究局(NRRA)。该机构还分享了 Redmi Watch 3 Lite 智能手表的真机照片,显示该手表采用矩形设计,内置 2.87V 的聚合锂离子电池,支持蓝牙 5.0。Redmi Watch 3 Lite 智能手表的外观感觉是 Redmi Watch 2 Lite 和 Redmi Watch 3 的混合体,配有一个物理按钮。I..

苹果为Apple Watch Ultra用户推出防水性测试IT之家 3 月 3 日消息,苹果公司今天发布了新的支持文档,为 Apple Watch Ultra 智能手表用户提供防水性测试,以确认手表深度计和密封件是否完好。Apple Watch Ultra 用户可以通过苹果的正常在线支持渠道为其设备申请水封测试。苹果首先会对 Apple Watch Ultra 进行外观检测,观察是否存在肉眼可见的损坏情况。苹果在外观上没有发现损坏情况,苹果将会进行水封和深度计测试。支持文档中还提醒,Apple Watch Ult..

消费者越不换机,手机厂商越“卷”?文/王慧莹编辑/李信时隔三年,伴随着MWC2023的召开,又到了手机厂商们秀肌肉的时刻。按照惯例,作为通信行业最大的全球性展会,也是全球最具影响力的移动通信领域的展览会之一,MWC一直都是各个手机厂商新品发布的集中地。某种意义上,MWC是手机厂商们新年的“第一战”,也是各大手机厂商的“验兵场”。华为的5.5G技术、荣耀的旗舰产品Magic 5、摩托罗拉的卷轴屏、一加的液冷概念手机……MWC 2023上,一个个全新的概念都被注入..

苹果想消灭挖孔屏!无奈难度太大自从2017年发布的iPhone X上首次搭载Face ID后,异形屏就成为了全面屏iPhone上的标志之一,尽管去年的iPhone14 Pro系列上将刘海屏设计变成了灵动岛。但相比安卓手机上小小的挖孔甚至是屏下摄像头方案,刘海屏和灵动岛设计明显无法满足用户对手机外观的追求。日前,据appleinsider报道,苹果正在研发新一代的屏下Face ID技术,将目前需要占用屏幕较大显示面积的3D人脸识别方案置于屏幕下方,兼顾脸部解锁和屏幕显示的一体性。..

2023年了,你的手机屏折叠了吗?作者丨像素编辑丨文八娘策划丨杨倩封面图来源丨OPPO微博本文为凤凰网科技x慢放联合出品自1999年摩托罗拉带着移动手机漂洋过海来到中国后,手机已经成为人们日常生活的刚需。20多年过去了,手机终端市场经历了多次产业跃迁,如今早已从千元智能机的缠斗中进入全新阶段,各大手机厂商纷纷加大对折叠屏手机的投入力度。似乎折叠屏手机已成为他们角逐的新战场。折叠屏手机,是刚需还是伪需求?全民手机被折叠屏统治的时代真的到来吗..

vivo攻克听障行业难题 “手语翻译官”功能正式发布凤凰网科技讯 3月3日,“OriginOS 国际爱耳日特别活动”在vivo总部成功举办,活动现场,vivo首次对外发布了“手语翻译官”功能——通过该APP,可以将健听人士的语音和文字,实时转变成为手语,还可以用文字、语音播报听障人士的手语动作。在“手语翻译官”的帮助下,听障人群不仅可以与家人、朋友更顺畅地交流,还能够更方便地点餐、购物等等。语音转文字、文字转语音,文字转手语和手语识别转文字,是实现无障碍沟通的核心技..

IDC:2023年智能手机市场仍旧难言乐观鞭牛士 3月3日消息,国际数据公司(IDC)手机季度跟踪报告显示,2023年智能手机市场仍旧难言乐观。2023年全球智能手机市场出货量将会低于12亿台,同比下降1.1%;中国市场出货量预计将仅有2.83亿台,同比也会下降1.1%。目前全行业寄希望于今年下半年,随着经济大环境的逐渐好转,全球及中国智能手机市场会有一定反弹,反弹趋势进而延伸到明年,实现智能手机市场的复苏。