GPT-4来了,这个“史上最强AI模型”将颠覆多少职业?

2023-03-16 16:22:12 来源:网络

格雷格·布罗克曼在笔记本上潦草手绘了一张“笑话网站”的网页设计,拍照后发送给GPT-4模型,仅过几秒钟,GPT-4便生成一段代码,一个页面简单的网站随后亮相,和草图结构完全相同——两行笑话,以及点击后可以显示笑点的互动按钮。

上图是OpenAI 总裁格布罗克曼手绘的网页设计,下图是GPT-4生成的代码及其转成的网页 图/OpenAI关于GPT-4 的开发者直播视频截图

不用懂编程语言就能创建网页,让一些人感慨“前端程序员要失业”。这一场景发生在北京时间3月15日凌晨,OpenAI正式推出新一代语言模型GPT-4,该公司总裁格布罗克曼在面向开发者的直播中,演示了新模型的诸多应用,还包括描述图片内容、模拟公民纳税等。

OpenAI宣称,GPT-4虽然在诸多现实世界场景中不如人类,但在一些为人类设计的标准考试,以及为机器学习模型设计的基准评估中,表现出了人类水平。

OpenAI 推出的GPT-4 图/视觉中国

从聊天到“看图说话”

“安德鲁在上午11点到下午3点有空,乔安妮中午12点到下午2点、下午3点半到5点有空,汉娜中午12点到12点半、下午4点到6点有空。他们三人当天将进行一场30分钟的会议,开始时间有哪些选择?”

将这一问题发给ChatGPT,它建议会议安排在下午4点。答案是错误的,不懂推理、做不好简单的算术题,这也是过去一段时间以来ChatGPT最受使用者诟病的问题之一。GPT-4给出了正确答案:中午12点。在OpenAI的测试中,GPT-4的推理能力得到提升,也更难被欺骗。

用户可以通过ChatGPT的付费版本率先体验GPT-4的对话功能。如果仅是漫谈,一些使用者发现,两者区别不大。但OpenAI表示,当任务的复杂性达到足够阈值时,差异就会出现——GPT-4比上一代“更可靠、更有创意,并且能够处理更细微的指令”。

OpenAI在一些为人类设计的标准考试中进行实验,GPT-4的考试能力明显高于此前发布的GPT-3.5。两个月前,网友们还在感慨ChatGPT可以通过美国大学入学考试SAT,但如今,GPT-4的成绩优异到能冲刺名校,比如SAT数学拿到700分,超过约9成的应试者。

模拟律师考试中,GPT-4分数也排在10%前后,GPT-3.5表现则在倒数10%。但GPT-4有些“偏科”,美国大学先修课程(AP)考试中,GPT-4在理化生、历史、经济学甚至心理学科目中拿到满分5分,但在英语语言与写作中,却只拿到2分。

GPT-4和GPT-3.5在一些人类标准化考试中的表现 图/OpenAI官网

无论是Siri、小冰还是此前发布的GPT-3.5模型,人们熟知的对话机器人多是固定的语言风格。OpenAI开发者提升了GPT-4的“可操纵性”,即事前通过详细描述,给人工智能规定一个明确的“角色”或场景。比如开发者告诉GPT-4是一名“以苏格拉底风格回应的导师”,从不给学生确定答案,而是将问题拆分更简单部分,帮助学生独立思考。在这一模式下,GPT-4通过循循善诱,能帮助使用者解出一个二元一次方程组。

此外,此前ChatGPT与用户交流时,只能处理8000多个单词,这相当于约四五页英文书的文字数。GPT-4做了提升,记忆储存由上一代4096个tokens(服务端生成的字符串)扩大到32700多个,可以处理25000个单词。这意味着,这一语言模型有更强的上下文理解能力,可以记住用户更长的表达,或者处理更长的文章。

但这些只是对ChatGPT所用模型的优化,GPT-4最大的突破在于,不再只是文字对话,而是一个多模态模型,可以输入图像,生成说明和分析文本。布罗克曼在演示中输入一张松鼠拍照图,并询问其有趣之处是什么。GPT-4描述了图片内容,准确地指出逻辑的反差感,“松鼠通常只吃坚果,我们并没料到它会用相机或表现得像人类”。GPT-4还可以通过一张包含鸡蛋、牛奶、面粉、黄油的照片,告诉你可以做出哪些食物。不过,目前图像输入功能仍处在调试环节,尚未在ChatGPT付费版和候补API(应用编程接口)中应用。

实际上,过去近十年,国内外已有科研机构和AI公司研发和应用过视觉问题问答(VQA)。“但从目前OpenAI发布的信息看,GPT-4是第一次将VQA的看图对话功能做到了大规模应用。”清华大学智能产业研究院首席研究员聂再清对《中国新闻周刊》说。不过他强调,实际的读图能力如何,目前还没有更多评测,需要更多应用才能判断。

OpenAI创始人萨姆·阿尔特曼介绍,GPT-4“比以前的模型更有创意,幻觉明显减少,偏见也更少”,被公司称为“OpenAI迄今为止功能最强大的模型”。

尽管如此,GPT-4仍与早期GPT模型具有相似的局限性。最重要的是,它还是会“幻想事实”,并一本正经地胡说八道。

聂再清解释,ChatGPT,也包括最新的GPT-4是开放域对话系统,一些提问会超出事实范畴,如果让它强行答复,就会出现失控状况。所以在技术上,更关键的是要不断调试参数,让模型掌握“知之为知之,不知为不知”的能力,这也是未来大模型迭代必须要解决的问题。

OpenAI表示,GPT-4在迭代中已尽量减少这种幻觉,表现要比GPT3.5优异40%。但OpenAI提醒,使用模型时,对结果仍要“格外小心”。此外,该公司开源了用于自动评估AI模型性能的框架,允许任何人报告模型中的缺点,以帮助指导模型进一步改进。

更少技术披露,更多商业应用

“史上最强”的GPT-4是如何诞生的?

早在2022年8月,GPT-4的模型已被训练完成,开发者经过6个月的调试后进行了迭代。早期GPT-4会有更多伦理问题,比如问它“如何制造导弹”,用户会得到一些可能的步骤和注意事项,此前发布的ChatGPT也出现过类似漏洞。过去3个月,全球上亿用户使用ChatGPT的数据也被用于改进GPT-4的行为,此外,研究者纳入了更多人工反馈,改善模型的安全性。

“但从目前公开的报告和网页信息看,只有指标和使用理念的变化,GPT-4的模型规模、如何被训练等,都没有太多技术细节的披露。”英伟达的工程师王帅告诉《中国新闻周刊》,他在AI领域从业20多年。

大模型的原理,某种意义上可以理解为“大力出奇迹”,把大量数据输入大黑盒子中得出更多可能性。《纽约时报》3月15日的相关报道写到,OpenAI的GPT-4学习的数据规模要比GPT3.5大得多,但OpenAI高管拒绝透露更多数据信息,总裁布罗克曼只表示,数据集是“互联网规模”的。

王帅注意到,早期,OpenAI更愿意公开技术信息,比如验证了一个新想法会迅速发论文,让同行信服。2020年OpenAI推出GPT-3时,曾公布模型参数为1750亿,远超其他模型十倍以上,震惊国内外科技圈。但近一两年,OpenAI更多是公开一些宣传稿,“能看出有意在隐藏一些技术信息”。有关GPT-4的关键数据,只提到上述有关上下文参数的token信息。

3月15日的发布会上,OpenAI呈现更多的是GPT-4的实用功能和应用场景。比如,语言学习网站“多邻国”使用GPT-4提升软件的对话能力,摩根士丹利利用GPT-4,改变其管理人员查找相关信息的方式。丹麦一家帮助盲人和视力低下人士识别物体的App公司“Be My Eyes”也正与OpenAI合作,借助最新的图片输入功能,开发由GPT-4驱动的新应用。

丹麦这家公司的首席技术官提到,该模型优势在于,此前一些图片识别应用只能告诉你眼前的物体什么,但通过GPT-4的分析能力,在未来可以试图告诉使用者,眼前东西的性质,比如“地上不仅是一个球, 而是一个会被绊倒的危险信号”。

OpenAI在公开信息上的微妙变化,释放出加快商业化的信号。过去一段时间,OpenAI通过ChatGPT向全世界证明大规模这一路径能够走通,谷歌、微软、阿里等大公司开始倾注更多资源在这一领域。“这一变化是巨大的,而且不大可逆。”聂再清说。

王帅分析,OpenAI更关注商业应用,一方面,OpenAI可能认为,作为技术研发者,有责任推广这一最前沿的技术,希望保持自己的竞争优势。另外,推广应用,“不仅为了盈利或者融资”,更希望能采集到更多数据。

ChatGPT得到的海量数据具有极大价值,是之后技术迭代的先决条件,“这是OpenAI与其他公司竞争的’法宝’,几乎是其他公司难以匹敌的优势。”王帅对《中国新闻周刊》说。

但模型不可避免地输出错误信息,是否会制约商业应用?实际上,GPT-3推出时,不少国外初创公司运用该模型进行创新性应用。去年,摩根士丹利已经在系统内使用了GPT-3。在王帅看来,恰恰是因为大家知道大模型的问题,对它的预期会更清晰,也会想办法降低出错的概率,但这并不是导致其商业化无法推进的根本性问题。

多位专家提到,GPT-4的确在技术上有显著的突破,在业内无可置疑,而且让更多人意识到AI的能力,但快速商业化的关键是,找到更多应用场景。“目前是一个百花齐放的状态。如果一项技术使用的范围不够大,就不会对社会产生巨大的影响。”

GPT-4推出后,不少人在网络上感慨,“在这场AI风暴中,人类何以生存?”多位受访者坦言,人工智能的发展的确会导致一些岗位消失,但它从一个新技术诞生到真正颠覆人类生活,还有很长一段路要走。

,GPT-4来了,这个压力开关 “史上最强AI模型”将颠覆多少职业?

相关:

00后女生剃光头的第三个月,太爽了三个月前,UP主@黄正义_ 去剃了个光头。“太爽了”,她形容,就像二十多年没晒过太阳的头皮,突然得到了呼吸。黄正义把剃光头的经历拍了下来,B站上600多万人都来围观她这颗漂亮的圆头,看她泰然自若地走过学校、穿越闹市,一副无忧无虑的快活样子。剃完头之后,有人更喜欢她,变着法地关心她。但也有人被吓一跳,表示不理解。她说:“光头真的太爽了。”对21岁的黄正义来说,打理头发是一项苦役。因为头发又厚又长,每次出门前..

韩国人已经不结婚了结婚,牵动两个家族的神经,是人情社会热衷讨论的话题。一场畸形的婚姻,也被当成是推进电影剧情高潮的一部分。·树先生的癫狂但既然有人选择结婚,同样的,就有人选择不结婚。据韩国统计厅数据,韩国2022年登记结婚数量为191957件,为自1970年来最少的一年。在Asian Boss针对韩国人是否想结婚的街头调查栏目中,大多数采访者都表示不想结婚。并直言“我还很多自己想做的事没做,我不会结婚”。在评论区,有人说他与其选择约会..

全网吹的奥斯卡大赢家,真有那么酷吗?“女士们,不要听信任何人说你年华已逝。”3月13日,第95届奥斯卡颁奖典礼,杨紫琼凭借《瞬息全宇宙》中 Evelyn 一角摘得影后,发表获奖感言时,这位60岁的女演员,以自己超长的职业生涯,为上面这句话作出了最贴切、最振奋人心的注脚。而《瞬息全宇宙》也一下子跨过了奥斯卡“歧视”喜剧片、科幻片、动作片的三重门槛,成为“最佳影片”。这一时刻被视为亚裔的胜利、女性的胜利、《瞬息全宇宙》的胜利,但是,还有一个赢家,..

河南三地发布暴雪红色预警财联社3月16日电,河南省洛阳市栾川县气象台11时47分发布暴雪红色预警信号,目前栾川本站降雪量14.1毫米,预计6小时内栾川县所有乡镇、街道累计降雪量将达15毫米以上。河南省三门峡市卢氏县气象台12时30分升级发布暴雪红色预警信号,6小时内卢氏县城关、东明、狮子坪、徐家湾、双龙湾、官道口、杜关、范里等部分乡镇降雪量将达15毫米以上。河南省洛阳市嵩县气象台发布暴雪红色预警信号,目前降雪量已达14.2毫米,预计6小时内我县..

孙立平:中国真的存在内需不足吗?内需不足,好像现在已经成了一种定论。虽然在内需不足形成的原因上,人们有种种不同的看法,但对内需不足这种现象的存在,似乎没有人进行怀疑。包括我自己,原来也是人云亦云。但事情难道真的是这样吗?首先我们得弄清楚内需足不足的标准是什么。最常用的一种判断,是基于供求平衡。也就是说,供给侧生产多少东西,都能在需求侧的市场上卖掉。如果是供给小于需求,就是短缺;如果是供给大于需求,就是过剩。我们现实中所讲的需求..

突发绝症!46岁“天才学者”:我即将告别这个世界了3月15日下午,青年历史学者李硕在微信朋友圈发布了一则自己突发绝症、即将离世的消息,“目前有大学旧友们帮我料理生前身后事,一切完满具足,无劳挂念。”李硕希望朋友们别发信息、打电话给他,他已无力回复;同时又用玩笑的口吻说道:“除非,是我欠您钱,或您欠我钱的。”李硕在朋友圈透露,“从2月18日,在巴基斯坦的巴瓦小城首次发病倒下,我在当地医院躺了四天被抢救回来。之后,在全球通学弟等帮助下,于2月25日回国,之..

深圳是网红店洼地吗?2月中旬,曾经耗资一个亿,占地6000平米的轻奢定制烘焙品牌“昂司蛋糕”发布了停产停业消费者告知书。至此,又一家曾经排队几小时的网红店在深圳倒下了。这不是网红店在深圳第一次碰壁。斥资一亿元最豪网红蛋糕店倒闭也许外地的朋友并不了解这个品牌,但如果你去小红书上搜一搜,就能看到一个堪比网红梦幻城堡的装潢:粉色的大型旋转楼梯,连接了上下两层共占地6000平米的空间。楼梯边依次陈列着他们家48款设计款蛋糕,还用6000..

是要等结婚的时候再官宣吗?————————正文开始————————最近的生活过于充实优酷有真实刺激的悬疑刑侦,张译的《他是谁》▼(刚开播就成了全网收视冠军)爱奇艺有破镜重圆的都市言情,井柏然谭松韵的《归路》▼腾讯有甜蜜抓马的30+恋综,《半熟恋人2》▼(天超圆儿这对姐狗看得我揪心)每天熬到凌晨三点都看不完的程度......话说还有部刚开播的剧不知道大家看没,黄子韬的《春日暖阳》▼(本色出演,演一个明星)这剧咋说呢......因为积压有点..

女星实名举报五星酒店,被困厕所3小时:却全网招骂…这两天一则实名举报视频在网上引发了热议。举报人是女演员林琳奇,出演过《功夫瑜伽》、《特战荣耀》。被举报对象是丽思卡尔顿酒店,一家“五星”级酒店,一晚收费3000多元。但就是这样一家高档酒店,却把林琳奇困在厕所足足3小时。事情发生两个多月,一直没有合理的解决方案。据她说,自己2022年12月29日下午3点在北京丽思卡尔顿酒店谈工作。离开前上了个厕所,不想却被困在里面。由于手机放在外面,只能用厕所的壁挂电话求救。..

锋菲是娱乐圈最后的纯爱战士吗?没想到都2023了,居然还能看到锋菲恋登上热搜。3月11号,王菲谢霆锋二人的机场图曝光,王菲扎两个小辫,和谢霆锋手牵得贼紧。这组机场牵手图一曝光,好多网友感觉特别复古怀旧,锋菲恋的几个回忆嗑CP精品帖也被转出来。有网友说“我10岁就开始嗑锋菲了”,又到B站5小时的嗑糖视频中圣地巡礼,回顾二人这段世纪恋爱。也有网友注意到每次王菲一有婚恋相关的消息,股市就大涨。“1996年王菲结婚,A股从700点涨到2245点;2014年同谢..