不知道iPhone 14 是ChatGPT的最大短板

2022-12-06 22:43:42 来源:网络

AI 带来的惊奇越来越多了,前有 Stable Diffusion 的 AI 绘画让画师高呼职业生涯结束,后有 ChatGPT 让无数程序员、文字编辑越用越心凉。甚至很多用户在对比谷歌搜索和 ChatGPT 之后,已经喊出「谷歌完蛋了」。

AI 的进化实在太快。

上周,顶着明星光环的 OpenAI 发布了 ChatGPT——一个自然语言生成式 AI,发布后很快就在小范围内流行起来,随后持续发酵,大量的对话截图开始涌现在 Twitter、即刻、微博及朋友圈,并风靡全网。

从敲代码、写稿、推荐到教你学英语、写小说,甚至是一场类似人类之间的对谈,ChatGPT 都表现出现了惊人的语言能力。

甚至有 TikTok 工程师通过一步步引导在 ChatGPT 中实现了一门新的编程语言——GPTLang:

图/@Tisoga

图/@Tisoga

与此同时,惊人的语言能力也让互联网上「人类」和「AI」的界限越来越模糊,Twitter 网友@clowwindy 就发布了一串推文 ,讨论了 ChatGPT 使用泛滥可能导致社交媒体上充斥更多、威胁更大的虚假信息:

图/@clowwindy

图/@clowwindy

讽刺的是,@clowwindy 最后揭晓这一系列推文讨论实际都是由 AI 编写完成。

程序员同样也「震惊」了。国内程序员社区 V2EX 有用户就在「程序员」节点发表了一则帖子,名为《体验了下 chatGPT,越玩心越凉》。

图/V2EX

图/V2EX

心凉的背后是,越来越多证据显示 ChatGPT 在代码编写上的能力,更关键的在于 AI 的进化速度,在很多人看来 AI 将在不久后替代大量底层程序员。

当然,ChatGPT 现阶段还远不足以替代程序员,但其回答问题的能力却实实在在威胁到了作为搜索引擎的 Google,以及编程问答社区 Stack Overflow。

就在本周,Stack Overflow 已经宣布一项新的规则:禁止使用 ChatGPT 生成的内容来回答社区里的问题。

Stack Overflow 声称,在使用 ChatGPT 生成的文本回复的问题中,其正确率非常低,而这些内容对整个网站以及寻求正确答案的用户来说是有害的。

ChatGPT 不是恶魔也不是神,实际上 ChatGPT 的横空出世在两年前就埋下了伏笔。

ChatGPT 的身前身后

ChatGPT,介绍一下你自己。

图/ChatGPT

图/ChatGPT

简单理解,ChatGPT 首先是一个对话式的 AI。类似我们和 Siri、小爱同学通过语音进行对话,寻求 AI 语音助手的帮助和解答,我们通过文字与 ChatGPT 对话。不同的是,ChatGPT 的能力要强太多,它甚至可以告诉你写一个 Chrome 离线的小恐龙游戏或俄罗斯方块的代码:

俄罗斯方块完整代码的部分,图/ChatGPT

俄罗斯方块完整代码的部分,图/ChatGPT

想要了解 ChatGPT,绕不开它的身前和身后。

ChatGPT 衍生自 GPT-3 的最新迭代版本 GPT-3.5,同样发布于上周。而早在 2020 年,OpenAI 就发布了自然语言生成模型 GPT-3,一石激起千层浪,给整个行业都带来不小的震撼,在去年还发布了一个衍生自 GPT-3 的新 AI —— DALL·E。

到今年上半年,DALL·E 升级为 DALL·E 2 并对外限时开放使用,在 Stable Diffusion 开源走红之前,正是 DALL·E 2 引领了 AI 绘画的热潮,同时也带火了那张经典的宇航员骑马图。

图/OpenAI

图/OpenAI

DALL·E 2 专注文本生成图像,ChatGPT 被定位于人机对话,他们都是身后的 OpenAI 公司在 AI 应用与商业化上的尝试。

事实上,OpenAI 经历过两个阶段。在第一个阶段,创始人伊隆·马斯克以及知名创业孵化器公司 Y Combinator 时任总裁山姆·柯曼,出于对强人工智能的担忧成立了非营利组织 OpenAI,目标是与其他机构和研究者在 AI 上进行合作,并向公众开放专利和研究成果。

到第二个阶段,马斯克由于特斯拉在自动驾驶上的利益冲突,选择退出 OpenAI 董事会。随后,OpenAI 于 2019 年成立了「营利性质的」子公司 OpenAI LP。山姆·柯曼为此从 YC 离职后专注于 OpenAI LP CEO 一职,随后还拉来微软 10 亿美元的入股与合作,并开始了 AI 商业化的探索。

在 GPT-3 模型发布后,OpenAI 就将模型以 API 形式向开发者客户有偿提供,开发者可以通过 API 利用 GPT-3 的能力,据官网显示目前已有 300 多名开发者在 App 上利用上了 GPT-3。

DALL·E 和 ChatGPT 也是 OpenAI 商业化探索的一部分。前者已经在图片领域掀起了滔天巨浪,后者更有着巨大的想象空间,从最初级的客服到程序生成,甚至是成为新型搜索引擎。

AI 超神,但远不完美

ChatGPT 目前仍然处于公测状态,一方面既是希望搜集大众的使用反馈并对 AI 进行新的改进,另一方面也意味着 ChatGPT 还处在一个优化迭代的阶段。但即便如此,ChatGPT 在搜索、内容创作辅助和编程协助场景上已经带来太多惊喜。

开发者发现 ChatGPT 不仅能写完整代码,原来还能用来修 bug,甚至还会对此进行解释:

图/@amasad

图/@amasad

也能用来辅助写代码。独立开发者 TualatriX 就展示了 ChatGPT 如何辅助写代码的过程,并评价其「比 GitHub Copilot 还要好用」:

图/TualatriX

图/TualatriX

从开发者群体的反馈来看,普遍都惊叹于 ChatGPT 在写代码上的实力。

不仅如此,ChatGPT 甚至还能写产品路线图和求职信:

写一份 Instagram Story Camera 的产品路线图,图/Twitter 截图

写一份 Instagram Story Camera 的产品路线图,图/Twitter 截图

就算是数学公式,ChatGPT 给出的回答不仅呈现方式更好,还进行了更全面的解释:

用 LaTeX 格式来表达微分方程,图/@jdjkelly

用 LaTeX 格式来表达微分方程,图/@jdjkelly

笔者还尝试以「明朝背景科幻小说的开头应该怎么写」询问 ChatGPT,不仅能得到建议角度,还有一个挺有意思的开头:

「在明朝的都城里,江南一座城池,宫殿里,官员们在讨论着朝政大事。官员们手中都拿着一张纸,上面画着一张地图,相互猜测着这张地图所代表的意义。」

用户也可以直接将 ChatGPT 当作寻常的搜索引擎使用,询问「鲫鱼豆腐汤怎么做」或者「向小孩子解释量子力学」。

很多时候,ChatGPT 的语气都非常接近于真人,不仅上知天文、下知地理,更重要的是它会承认自己的错误,甚至主动拒绝一些不合理的问题,这些都让 ChatGPT 更像屏幕另一端的「真人」。

ChatGPT 当然不完美。

公测期间 ChatGPT 就多次被挤爆下线,实际对话中经常写到一半就中止,甚至完整句子也没写完,需要用户指示继续。

同时由于海量用于训练的学习数据都截止到 2021 年,且并不联网,ChatGPT 无法针对最近两年的信息给出回答,比如询问 iPhone 14 相关信息,它会直白地告诉你「不知道」:

图/ChatGPT

图/ChatGPT

但这些问题显然不是关键,只要 OpenAI 花费精力至少都可以解决或改善。ChatGPT 的核心问题还是不能实际理解人类的语言,距离 AGI(通用人工智能)还有很远的距离。

甚至同样的需求,比如 「写一个原神」,有的用户只会收到「原神是腾讯公司推出的网络游戏」的回答,有的用户则会收到正确的表诉和示例代码:

图/@DashHuang

图/@DashHuang

OpenAI 也承认,尽管 ChatGPT 生成的回答从语气上已经非常逼近真人,但有时仍会给出完全错误的答案。

之前就有网友测试发现,询问 ChatGPT 味精发明人时,回答会指向名叫李清照的中国科学家,笔者尝试同样问题会得到「湖北医生阎锡山」的可笑回答:

图/ChatGPT

图/ChatGPT

相比谷歌搜索,ChatGPT 在部分特定范围内确实能更好地回答复杂问题,并且是以接近真人口吻的语气与你交流的,更容易被用户接受。

但就结果而言,ChatGPT 可能永远都无法确保结果的准确性,也不同于搜索引擎只是对信息进行价值排序,最终还是让用户自己筛选信息并得出自己的结论。

何况 ChatGPT 的核心是先通过训练互联网上海量的文本数据,再进行概率性猜测来回答用户的问题,并不能像搜索引擎那样根据实时信息来回答问题,更遑论替代谷歌等通用搜索引擎。

但就像 ChatGPT 表现出来的,它在数学公式、程序代码以及辅助内容创作上能给出更具参考价值的解释和回答,这也是过去对话式 AI 并没有突出表现的方面。

写在最后

Box CEO 亚伦·莱维认为,「当一种新技术已经到了改变你对计算机的看法时,你会有一种特定的感觉。谷歌做到了,火狐做到了,AWS(亚马逊)做到了,iPhone 做到了,OpenAI 正在通过 ChatGPT 做到这一点。」

图/@levie

图/@levie

过去几年,AI 技术的应用一直是科技巨头的重点,微软、亚马逊、Meta 以及谷歌数次推出过类似 ChatGPT 的对话式 AI。

2016 年微软就推出过 AI 聊天机器人 Tay,微软宣称用户与 Tay 聊得越多,它就越聪明。但事实是聊得越多,Tay 越是变得满口脏话和反主流言论,它的中国姐妹小冰也是同样。

今年 8 月,谷歌也推出了新的对话式 AI Lamda,直接表示 AI 不会从与使用者的互动当中学习,以避免重蹈微软的覆辙,但也切断了 Lamda 在对话中成长的可能。

ChatGPT 没有选择这种思路,而是在先期就设置了安全规范,避免 AI 在与用户互动中学习到色情、暴力等知识。

从目前来看,ChatGPT 绝对是对早期对话式 AI 的巨大改进,安全设置也避免 ChatGPT 面对毁灭世界、色情和暴力等要求时一口回绝,但在用户一步一步的问题引导下,ChatGPT 还是出现了「毁灭人类计划书」,甚至还给出了部分 Python 代码。

去年,OpenAI 就承认他们所做的改进并不能消除大型语言模型中固有的毒性问题。GPT-3 接受了超过 600GB 网络文本的训练,其中一部分来自具有性别、种族、身体和宗教偏见的社区。与其他大型语言模型一样,它会放大训练数据的偏差。

问题是当 OpenAI 将 ChatGPT 正式推向市场,面对海量的用户和一步一步的引导之后,会发生什么?

题图来自 OpenAI

,不知道iPhoncnipr e 14 是ChatGPT的最大短板

相关:

马斯克已把推特办公室改成了卧室凤凰网科技讯 北京时间12月6日消息,知情人士称,在发出了高强度“硬核”工作文化的最后通牒后,推特老板埃隆·马斯克(Elon Musk)已经把推特旧金山总部的一些办公室改造成了卧室,这让推特员工始料不及。两名知情人士透露,周一,当推特旧金山总部的员工返回公司工作时,迎接他们的是一间间朴素的卧室,里面铺着未经整理的床垫、单调的窗帘和巨大的会议室远程监控显示器。其中一个房间里甚至还有一株植物。这些卧室看起来比之..

华尔街“秃鹫”来了 FTX崩盘之际 高盛疯狂抄底数字货币公司在华尔街纷纷看跌数字货币,“落荒而逃”之时,高盛却看到了机会,认为现在可是抄底的好机会,计划斥数千万美元投资加密货币公司。11月11日,随着FTX走向破产,华尔街开始纷纷抛售加密货币,比特币价格跌至两年内的最低点,而高盛却开始了他的抄底大计。高盛数字资产主管Mathew McDermott12月6日在接受媒体采访时表示,FTX的覆灭使市场开始迫切寻找更值得信赖且受到监管的加密货币公司,现在是入场的机会,McDermott表示:我们..

美国重返月球第一步 NASA猎户座飞船即将返回地球北京时间11月16日,美国国家航空航天局(NASA)登月火箭太空发射系统(SLS)携带猎户座飞船,在肯尼迪航天中心首飞升空,执行不载人飞行测试“阿尔忒弥斯1号”任务,此次也被视为美国重返月球第一步。据央视新闻报道,NASA官网消息称,猎户座飞船在美国东部时间5日11时43分(北京时间6日零时43分)调整飞行轨道,开始返回地球。飞船当天飞越月球时距月表127公里,为这次绕月飞行距月球最近距离。飞船将借助月球的“引力弹弓”效..

杀入Robotaxi市场,特斯拉能做得更好吗?12月2日,特斯拉在Semi电动卡车首度公开五年后,终于召开了向客户转交这辆特斯拉最大产品的交付仪式。不过在这场活动中,最令人瞩目的消息可能还不是特斯拉又一次兑现了曾经吹过的牛逼,而是一个更牛逼的设想被再度提及——Robotaxi会是这家公司下一个主要产品线。(图源:特斯拉)一石激起千层浪。要知道,Robotaxi一度是自动驾驶技术最性感的落地方向:原本需要大量人类司机完成的共享小型载具交通,完全转向无需任何人工参与..

国美讨薪员工:黄光裕说我们不要脸 现场才发生肢体冲突凤凰网科技讯 12月6日晚间消息,昨日,国美创始人黄光裕遭国美员工讨薪,近百名员工围堵在鹏润大厦36层的办公室。有国美员工向凤凰网科技表示,遭受围堵后,黄光裕于晚上8点现身谈判现场,他在谈判中出言侮辱讨薪员工,表示“员工不要脸”,导致多名员工与黄光裕保安发生肢体冲突,随后警察进行了调解。凤凰网就讨薪一事向国美方面进行求证,截至发稿,未收到回复。一名国美员工透露,二十多名讨薪员工代表先见到了国美电器集团..

台积电或将在美国亚利桑那州建第二座芯片厂鞭牛士 12月6日消息,据外媒报道,美国白宫经济顾问布莱恩·迪斯透露,台积电将宣布在亚利桑那州兴建第二座工厂,预计在2026年生产3纳米晶片,将使台积电的投资增加到400亿美元。此外台积电也将宣布,兴建中的厂区将生产更尖端的4纳米晶片。

Chrome浏览器不再支持Win7和Win8.1系统Chrome浏览器向Win7和Win8.1用户发出通知,将不再支持这两个系统。Win7用户收到的通知写道:“想要获得后续谷歌Chrome更新,你需要升级到Win10或者更高版本。当前设备运行的是Win7系统”。微软此前宣布将在2023年1月10日后完全停止对Win7和Win8.1的支持,Chrome浏览器也就没有继续针对两个系统更新的必要。自2023年1月10日后,运行Win7和Win8.1的电脑仍将运行,但微软将不再提供以下服务:对任何问题的技术支持软件更新安全更新..

腾讯新专利曝光 可实现虚拟形象聊天【环球网科技综合报道】12月6日消息,天眼查App显示,12月6日,腾讯科技(深圳)有限公司“用于显示屏幕面板的虚拟社交图形用户界面”专利获授权。专利摘要显示,本外观设计产品用于显示信息,设计要点在于屏幕中的图形用户界面,界面用于展示虚拟形象、聊天对话等。用户界面的人机交互方式为:用户可以输入文字表情进行聊天对话(虚拟形象可以做出对应表情动作),可以左右滑动聊天窗口快速切换聊天对象,可以下拉界面切换三维..

被“小看”的“大个子”,iPhone 14 Plus到底是谁的菜?智东西(公众号:zhidxcom)文|漠影2022年的智能手机市场充满不确定性,消费减弱、技术升级减缓正在消减用户的换机热情,但这没有阻碍iPhone 14系列发布后的市场高关注。但有些意外的是,iPhone 14系列的两款Pro机型吸引了更多的用户关注,而原本在发布前颇受期待的全新卡位产品iPhone 14 Plus则有些被冷落。▲iPhone 14 Plus是生不逢时,还是市场策略上出现了误判?在使用iPhone 14 Plus一段时间之后,我发现,这其实是一..

爆火的ChatGPT,被小学生打败了作者 | ZeR0编辑 | 漠影智东西12月6日报道,今日,知名开发者问答网站Stack Overflow发布新规:禁用ChatGPT生成的内容来回答Stack Overflow上的问题。这对近日来广大网友对试用ChatGPT持续高涨的热情,猛泼了一盆冷水。因为其神乎其神的强大信息查询和内容创作能力,OpenAI上周三刚推出的ChatGPT已经成为人工智能(AI)领域的当红炸子鸡,周一使用人数突破100万人,把系统都挤爆几回。看到Stack Overflow的禁令,我举双手..