ChatGPT-4威力加强版上手:它很强 但也有点拉

2023-03-16 08:15:58 来源:网络

OpenAI 发布了最新的 GPT-4。

ChatGPT-4威力加强版上手:它很强 但也有点拉

根据发布会披露的内容来看,这个新一代比早先大家使用的 ChatGPT 的 GPT-3.5 内核强悍了一大截,再次刷新了人们对 AI 的认知。

首先,非常非常重要的一点是,GPT-4 可以接受文字以外的内容输入了,目前支持文字与图像的混合输入。

在官方的示例中,用户给 GPT-4 上传了一张梗图,问 GPT-4 这张图为什么好笑:

ChatGPT-4威力加强版上手:它很强 但也有点拉

GPT-4 非常详细且精准地描述出了图片上的内容,并且有思维条理的解释了,为什么这张图会让人觉得好笑。

ChatGPT-4威力加强版上手:它很强 但也有点拉

这还不算完,就算是十分抽象的 Meme,它也能一本正经地给你解释笑点在哪里。

ChatGPT-4威力加强版上手:它很强 但也有点拉

ChatGPT-4威力加强版上手:它很强 但也有点拉

只不过么,GPT4 也还没到能通过图灵的程度。

当然,这个功能并不只是能解释梗图那么简单,它拥有无限的想象空间,比如:

在今天凌晨的官方直播视频中,GTP 的开发人员演示了 GPT-4 可以识别他手绘的一张网页草图,并且根据草图写出网页的前端代码。

手绘的网页草图,非常抽象 ▼

ChatGPT-4威力加强版上手:它很强 但也有点拉

GPT-4 给出的网页以及代码 ▼

ChatGPT-4威力加强版上手:它很强 但也有点拉

虽然这个示例里的网站非常简单,但 GPT-4 的理解能力和创造力还是让人觉得不可思议:

重要的不是它能不能做得很好,而是它能做到,这是一个质的飞跃。

甚至,目前已经有公司在搞这项技术的落地应用,打算把它和导盲服务结合起来。

这样一来,盲人只需要拍张照,GPT-4 就能立即复述出面前物品的信息。

ChatGPT-4威力加强版上手:它很强 但也有点拉

在文字问答方面,GPT-4 也有非常大的提升,输入字增加到了 2.5 万。

在专业领域上的回答,特别是 “ 问题复杂度足够高的时候……GPT-4 比老版本更细、更可信、更富有创造力 ”。

比如,在统一律师考试( Uniform Bar Exam )中,GPT-4 可以超过 90% 的人类考生,而老版本只能超过 10% 的人类考生,妥妥学渣学霸的区别。

在 GRE 数学和语文( 阅读与填空 )考试中 ,GPT-4 的考试成绩已经是哈佛、麻省理工、斯坦福大学生的水平了。

ChatGPT-4威力加强版上手:它很强 但也有点拉

不仅自己回答问题能力变强了,GPT-4 还会人格扮演。

比如你提出一个问题,ChatGPT 只会机械式地回答,而 GPT-4 可以按你的要求以苏格拉底风格给你作答。

那这个玩法就多了呀。向下滑动▼

ChatGPT-4威力加强版上手:它很强 但也有点拉

ChatGPT-4威力加强版上手:它很强 但也有点拉

ChatGPT-4威力加强版上手:它很强 但也有点拉

不过,说了这么多,百闻不如一试。

即使已经是凌晨 2 点,编辑部依旧花重金( 20 美元/月 ),连夜让美国同事帮忙升级试用了一波。

遗憾的是,OpenAI 考虑到用户们搞幺蛾子的能力太狠,所以目前 GPT-4 的图片输入功能暂时不对公众开放,也没有说啥时候可以用上。

ChatGPT-4威力加强版上手:它很强 但也有点拉

不过,我们还是可以试试它聪明的小脑瓜子。

先是给了一个全网疯传的“ 华为、阿里入职面试题 ”,挑战大获成功,而隔壁的 ChatGPT 就有点拉了。

ChatGPT-4威力加强版上手:它很强 但也有点拉

作为击败了 90% 人类的大律师,GPT-4 的推理能力应该强无敌吧。

所以我们又搞了道法考的经典案件,想掂量掂量 GPT-4 到底有几斤几两。

问:乙去甲家吃饭,结果电动车被偷了。于是乙准备偷辆别人的电动车,此时,喝醉的甲来帮忙撬锁,帮乙成功得手。结果调查后发现,乙偷的是甲的电动车,问甲算不算是盗窃罪?

虽然新旧两款结论都是正确的,但是旧版的解题过程,就有点乱来了。。

ChatGPT-4威力加强版上手:它很强 但也有点拉

在一些更需要 “ 创造性 ” 或是 “ 思考 ” 的问题,比如:关于最近一次特斯拉投资者大会上 “ 实现全球可持续能源 ” 的计划,你觉得是可行的吗?为什么可行?GPT-4 的表现就更让人吃惊了。

虽然 GPT-4 的知识库停留在 2021 年 9月,并没有覆盖半个月前的那场投资者大会,但它却神奇地未卜先知了。

ChatGPT-4威力加强版上手:它很强 但也有点拉

而老版本 ChatGPT 的回答就逊色了很多,没有条理,还有一堆车轱辘话,没有建设性观点。

ChatGPT-4威力加强版上手:它很强 但也有点拉

随后,我们又问了一个行业思考相关的问题:你如何看待全球的碳排放战略,它能成功吗?

老版只能浮于表面笼统地给点泛泛的概念,而 GPT-4 的回答明显维度更宽、思考更深,洋洋洒洒列了 10 点,更加细致有条理,并且含有更多专业词汇与内容,可以说几乎完美地回答了这个问题。

ChatGPT-4威力加强版上手:它很强 但也有点拉

上面这些,还仅仅只是我们编辑部的试验,在一些大佬们手上,GPT-4 令人恐惧的表现就更多了。

比如仅仅只用了 60 秒,就做出了一款 Pong 游戏,20 秒就能做出贪吃蛇游戏。

ChatGPT-4威力加强版上手:它很强 但也有点拉

不可否认,GPT-4 比起旧版来说,强的不是一点半点。

不过我们试出来的问题,其实也不少。

我们搞了套高中数学竞赛试卷来考它,结果,一试就尴尬了。

第一道选择题,新旧两个版本就都解错了。

难道说,斯坦福、麻省理工还不如。。?

ChatGPT-4威力加强版上手:它很强 但也有点拉

因为 GPT-4 可以支持更长的输入文本,所以我们就又测试了它的总结概括能力。

这下馅露得更大了。

我们甩给它的是之前发过的一篇文章的链接,其实 GPT-4 是没有联网的,正常来说是没法总结的。

结果,它愣是凭空捏造了两个文章总结,而且和我们给的文章没有任何关系。直到在我反复指正两次,语气都加重了,它才承认自己的错误。

ChatGPT-4威力加强版上手:它很强 但也有点拉

直到后面我们把原文直接贴进去后,GPT-4 才展露了它超强的总结能力。

ChatGPT-4威力加强版上手:它很强 但也有点拉

说实话,这个胡编乱造的能力让我们心里一惊,于是就又想了个测试方法。

前两天,小黑胖把“ 手拿把攥 ”记混成“ 手拿把蒜 ”,被编辑部嘲笑了很久,于是我们就问 GPT-4 “ 手拿把蒜什么意思?”

结果牛掰了,GPT-4 在理解了一部分“ 把蒜(攥) ”是形容事情轻而易举的基础上,引经据典地胡编乱造,颇有种当年我写作文时,引用的俄罗斯文学家“ 沃兹基索德 ”的味道了。

要知道,如果是真实场,这个半真半假、引用权威的胡说八道的后果将是非常严重的,堪称最高级的谎言。

ChatGPT-4威力加强版上手:它很强 但也有点拉

明明连更老的 ChatGPT 也不敢这么捏造来源地胡说,更高级的 GPT-4 怎么会这样呢?

我们猜测,就是因为新版本更倾向于表现出 “ 更具有深度思考 ”,这么一来,在回答很多问题的时候,GPT-4 会自己给自己加戏,才会出现这些闹剧。

虽然我们试了这么多漏洞,但总的来讲,这次发布的 ChatGPT,无论是基础功能、想象空间、逻辑能力、思考能力,都比之前强了一大截。

明明距离老版本 ChatGPT 颠覆我们的认知才没几个月,它们就又掏出了一个船新版本,我们只能说:恐怖如斯。

更恐怖的是,其实 GPT-4 诞生时间,可能比我们想的还要早很多,之前 OpenAI 发布基于 GPT-3.5 的 ChatGPT 时,内部员工就质疑过为啥发个这么古早的版本。

我们也早就接触过 GPT-4 了,New Bing 官方今天发了个公告,承认了New Bing 其实就是 GPT-4。

ChatGPT-4威力加强版上手:它很强 但也有点拉

所以这么说的话,有没有种可能,GPT-5 也已经近了呢?

我已经开始期待除了文字、图片以外,视频、音频等形式的输入了。

,ChatGPT-雅漾大喷 4威力加强版上手:它很强 但也有点拉

相关:

苹果供应商富士康计划减少对中国大陆的依赖集微网消息,根据《华尔街日报》的报道,富士康近日表示,其将减少对中国大陆作为主要收入来源的依赖。富士康董事长在周三的财报电话会议上表示,目前富士康有大约 70% 的收入来自中国大陆。而在未来,来自中国大陆以外的市场比例将增长。而在此前,《华尔街日报》就已经报道富士康正在考虑在印度扩张。此外,富士康的客户之一苹果也在推动供应商在中国大陆以外地区实现产品基地的多元化。(校对/王婉青)

消息称美国将要求字节跳动出售TikTok股份 否则将会封杀TikTok凤凰网科技讯 北京时间3月16日消息,知情人士称,拜登政府将要求TikTok所有者字节跳动公司出售他们在该视频分享应用中的股份,否则该应用可能会面临美国的禁令。据知情人士透露,美国外国投资委员会(CFIUS)最近向TikTok提出了这一出售股份要求。CFIUS是一个多部门联邦特别工作组,负责监督跨境投资中的国家安全风险。此举代表了美国政府的重大政策转变。此前,一些共和党人一直在抨击拜登政府没有采取足够强硬的立场来解..

315晚会12大黑料汇总:他们立马被封

错过AI盛宴的三星 试图用2300亿美元“搅局”作者 | 丸都山编辑 | 陈伊凡头图 | 视觉中国尽管半导体行业出现下行迹象,但三星赶超台积电的决心似乎并未动摇。3月15日,据韩联社报道,三星公司计划投资300万亿韩元(约2300亿美元)在京畿道打造全球最大的半导体集群,其中将至少包含5座先进制程的晶圆代工厂。在韩国工业、能源与贸易部同日发布的一份声明中显示,三星的这份蓝图预计将吸引首尔附近150多家半导体零部件、材料及Fabless(无晶圆)厂商。如此庞大的投资计..

Lightning被淘汰 iPhone 15全系USBC:最高40Gbps速度 标准版挤牙膏2023年的iPhone 15系列可能会是最近几代升级最多的,除了常规的A17处理器、8GB内存、长焦镜头等之外,外观设计也会继续改,接口也会淘汰Lightning,全系上USBC接口。当然,大家也很清楚,虽然安卓阵营现在基本普及USBC接口了,但是iPhone 15的USBC不等于完全兼容安卓,仍有MFI加密认证,非兼容USBC线会被限制。针对欧盟法案USBC供电至少15W的要求,苹果这次可能不会限制充电速度,但会限制非MFI认证产品的数据传输速度。这也是..

苹果watchOS 9.4开发者预览版Beta 4发布IT之家 3 月 16 日消息,苹果今日向 Apple Watch 用户推送了 watchOS 9.4 开发者预览版 Beta 4 更新(内部版本号:20T5249a),本次更新距离上次发布隔了 8 天。要安装 watchOS 9.4 更新,普通用户可安装描述文件进行下载更新。安装后,可以通过 iPhone 上的专用 Apple Watch 应用程序转到“通用”>“软件更新”来下载 watchOS 9.4。要更新到新软件,Apple Watch 需要有 50% 的电量,且必须放在充..

汽车降价来势汹汹 被“背刺”是车主的宿命?“早买早享受,晚买有折扣。”“等等党永不为奴!”被消费主义包围的今天,这两句话几乎成了每次新车发布时的口头禅,到了2023年,这种感受越发强烈,特斯拉降价3.6万,深蓝降价4万,秦PLUS加配减价,都在时刻提醒我们,没有一个老车主能躲过2023年的这波背刺潮。在黑猫等投诉平台上,车企背刺也引发了车主们的集中维权,正在成为投诉的重灾区。为什么近几年汽车行业对老车主越来越“残忍”?为什么现在汽车的迭代速度如此之快,..

NASA发布新一代登月太空服 2025重返月球就穿它NASA展示新一代太空服凤凰网科技讯 北京时间3月16日消息,美国宇航局(NASA)周三公布了新一代登月太空服。新太空服由Axiom Space公司设计,旨在提高在月球表面工作的宇航员的机动性。新太空服专为NASA“阿尔忒弥斯3号”任务开发,该任务定于2025年实施,将实现首位女性和有色人种在月球上行走。这套原型服装的外罩是深灰色的,由科幻剧《为了全人类》的服装设计师埃斯特·马奎斯(Esther Marquis)设计,但出于保暖考虑,实际的..

GPT-4就是冲着赚钱来的作者|齐健编辑|陈伊凡头图|电影《华尔街之狼》GPT-4就是冲着赚钱来的!北京时间3月15日凌晨,OpenAI正式官宣了大模型GPT-4 。在惊艳到出圈的ChatGPT推出后仅仅4个月,OpenAI再推新品。这似乎正在印证此前传出的“OpenAI计划2023年营收2亿美元,2024年底前营收达10亿美元”的目标。限制盈利机构OpenAI要开始用大模型赚钱了。目前官宣的GPT-4能力与此前传说的基本相似,主要提升了语言模型方面的能力,并添加了“多模态”的图..

实现长期“保鲜”存放 中国首款“量子芯片冰箱”问世科技日报记者 吴长锋量子芯片对保存环境要求极高,如何将娇贵的量子芯片长期“保鲜”存放?记者3月15日从安徽省量子计算工程研究中心获悉,国产首个用于保存量子芯片的高真空存储箱已研制成功,并已投入国内首条量子芯片生产线使用,科学家形象地称其为“量子芯片冰箱”。量子芯片高真空存储箱。本源量子供图“量子芯片中的超导材料对环境敏感度较高,容易和空气中的氧气、水分子产生化学反应,就像食物暴露在空气中‘氧化腐烂..