站在风口的生成式AI,离真正起飞还有多远?

2023-08-03 00:14:22 来源:网络

生成式AI技术无疑是当前最大的时代想象力之一。

资本、创业者、普通人都在涌入生成式AI里去一探究竟:“百模大战”连夜打响,融资规模连创新高,各种消费类产品概念不断涌现……根据Bloomberg Intelligence 的报告,2022年生成式AI 市场规模仅为400 亿美元,预计到2032年这一数字将突破1.3 万亿美元,未来10 年的年均复合增速高达42%。

然而,表面上看着热闹非凡,但生成式AI技术的普及和转化真的有我们想象的那么高吗?

在经历了爆发式增长之后,6月以来,生成式AI聊天产品访问量几乎都出现了不同程度的下降。最新用户调查显示,有80%-90%以上的受访者表示未来六个月都完全不会使用ChatGPT、Bard等聊天工具。从消费端看,大家目前似乎更多地把生成式AI产品当成了一种追赶时尚潮流的玩具,而非持续使用的工具。

而在企业端,这样的现象就更为明显。一旦人们切换到工作模式时,生成式AI工具便很少出现在大家的工作流程中,甚至还被很多大型公司等明令禁止或限制性使用。

图片来自于摩根史坦利调查报告

图片来自于摩根史坦利调查报告

对于一个比较成熟技术的商业转化来说,6个多月的时间并不算短。但目前,关于生成式AI的狂想焦点似乎仍然还停留在大模型和产品概念上,人们预期所想看到的繁荣生态和对经济社会所产生的变革性影响还尚未到来。

那么,究竟是什么桎梏着它的发展?

生成式AI的落地之困:如何打破基础模型和开发者之间的“墙”?

所有人都不想错过生成式AI浪潮。但当前生成式AI的超高进入门槛,把大部分玩家挡在了门外。

过去这些年来,通过“深度学习+大算力”进行模型训练是实现人工智能最主流的技术途径。但大模型的商业化落地,必须得先回到成本核算上。

首先,大模型对算力的需求极大,是一个巨型“吞金兽”。GPT-3.5模型的训练一次的成本约在300万到460万美元之间,一些更大的语言模型训练成本甚至高达1200 万美元。自研大模型是一个“无底洞”,不具备雄厚资金实力的创业公司根本无法承担。

此外,通用模型并不能解决所有问题,能帮企业完成的事情非常有限。大模型的训练都是基于互联网上的公开数据完成,很多产品也相对孤立没有形成一个连贯的、整体的工作流,不具备定制化能力。意味着开发人员需要结合私有数据做大量个性化调试,开发训练门槛极高。

而由于前期的巨额投入,就算大模型开始商业化之后,要实现盈利也往往需要长时间的积累。因此,要想生成式AI技术真正落地到各行各业中发挥效力,当前急需一种可负担、高效率、低门槛的解决方案,让更多人参与到入生成式AI的开发中来。

那么,如何才能弥合从基础模型到终端应用之间的鸿沟?目前来看,提供一站式AI专业托管服务的云平台或许是当前的最佳解决路径。

云平台拥有充足、灵活的算力资源,中小型企业不必自行购买和维护昂贵的硬件设备,即可满足个性化的开发需求。用户可以通过 API和SDK,便捷地调用云平台上的第三方资源和大包服务,将他们的应用和服务与云平台无缝衔接,最大化简化开发流程。

此外,云平台还能够帮助解决数据的隐私安全问题。过去几个月来,包括苹果、三星、台积电、美国银行等很多大型企业都相继出台相关政策明令禁止员工使用ChatGP,纷纷开始自研大模型。而对于那些不具备自研实力的中小型企业来说,选择能够提供包括数据加密、身份验证、合规性工具等安全措施的云平台则是一个很好的低成本选项。

大量公司禁止在工作中使用聊天机器人等产品,图片截自于雅虎财经

大量公司禁止在工作中使用聊天机器人等产品,图片截自于雅虎财经

针对当前的生成式AI浪潮,云平台是否已经具备大模型开发的相当能力,能够提供生成式AI的全流程服务呢?

在刚刚落幕的亚马逊云科技纽约峰会上,我们看到了一份基于云的生成式AI完整解决方案。

亚马逊云科技,创建生成式AI普惠新范式

此次,亚马逊云科技延续了过去一贯的“务实”风格,瞄准当前生成式AI应用转化所面临的痛点问题,上新了一系列全新的功能和服务。从硬件到软件,从开发端到应用端,试图打造一个功能最全、能力最强的生成式AI服务平台。

Amazon Bedrock服务:搭建生成式AI开发的“快速通道”

针对开发层面基础模型训练成本昂贵、环境部署复杂的问题,今年4月,亚马逊云科技首次宣布推出Amazon Bedrock服务,允许用户通过可扩展、可靠且安全的亚马逊云科技托管服务,用API来便捷地访问来自不同供应商的基础模型,并利用它们来构建生成式AI应用程序。

当时,除了自家的Titan大模型之外,首发第三方合作商及基础模型还包括AI21 Labs的Jurassic-2,Anthropic的Claude,以及Stability AI的Stable Diffusion。在这次的纽约峰会上,亚马逊宣布再次增加前生成式AI领域的最大独角兽之一的Cohere作为供应商,也新增了包括Anthropic最新的语言模型 Claude 2,和Stability AI最新版文生图模型套件 Stable Diffusion XL 1.0等基础模型。

亚马逊云科技认为,未来一定不会是一个模型统管一切,Amazon Bedrock通过不断集成业界最领先的基础模型,用户将可以根据自身需求来便捷地调用最合适的模型。

Amazon Bedrock支持模型,图片来自亚马逊云科技纽约峰会

Amazon Bedrock支持模型,图片来自亚马逊云科技纽约峰会

但基础模型有了之后,还有一个棘手的问题没有解决——如何使用这些模型进行个性化的应用开发?云平台还要进一步解决私有数据学习、系统集成和调试以及任务自动执行的问题。

举一个我们在日常生活中经常会遇到的电商退换货的例子。你在电商平台买了双鞋子不太满意想要找客服换一个颜色,如果此时客服是ChatGPT等通用聊天机器人,他会怎么回答你?——“抱歉,我的训练数据截止日期是2021年9月,没有这双鞋的相关信息。”

要想让大模型真正发挥作用,首先要做的就是提前把公司内部跟这双鞋所有有关的信息都“喂”给模型,包括鞋的型号颜色、平台的退换货政策、库存信息等等,模型才能准确地给出反馈。在给出信息的同时,还需要AI一边聊天一边能在后台有序、安全地执行有关换货的所有操作。

在过去这对于开发者来说是一个庞大的工程,但现在,亚马逊新推出了一项名为Amazon Bedrock Agents服务,让这一切变得触手可及。

最新的Amazon Bedrock Agents服务能够在基础模型的基础上,把对话的定义、模型外部信息获取和解析、API调用、任务执行等打包成为一个全托管式的服务,从而能够及时、有针对性的输出结果。

如此一来,开发者不必重巨资从头开发自己的基础模型,也不要花费大量的时间和人力去进行模型的个性化部署和调试,从而能让开发者把更多的精力放在AI应用的构建和运营上,让不具备雄厚资金和技术实力的中小型开发者都可以加入到生成式AI浪潮中来。

“向量数据+硬件算力”双护航,铸造应用开发的最强大脑+最强底座

进行模型的定制开发,除了需要如Amazon Bedrock这样的专业托管服务,也需要计算、存储、安全等其他相关能力,来保证模型的持续可用、和迭代升级。

毋庸置疑,数据是人工智能出现和发展的基底。生成式AI为了学习和理解人类语言的复杂性,需要大量的训练数据,而这些训练数据通常是以“向量”的形式存在,也就是把自然语言转化为计算机可以理解和处理的数字。

那么,什么是向量数据,为什么它对生成式AI的发展至关重要呢?

假设你正在使用一个音乐推荐软件,我们可以把每首歌分别按照节奏、歌词、旋律等三个特征进行量化标记,比如第一首歌是(120,60,80),第二首歌是(100,80,70),当你告诉系统你喜欢第一首歌的节奏时,系统便会找到这首歌的节奏向量数据“120”,在数据库中查找与这个向量相似的其他向量,接着再把有相似特征的歌曲推荐给你。

当然,不止是三维,一个数据还可以被标注成更多纬度。在自然语言处理中,使用词嵌入技术表示的“词向量”通常是几百维的,而在图像处理中,使用像素值表示的图像向量可能有数千到数百万的维度。被“向量化”之后的数据将被存储在向量数据库之中,在高维空间中去高效地检索和生成最相关或最相似的数据。

然而,要将数据进行向量化处理和储存并不是一件容易的事,往往要耗费大量的人力和时间。针对这一问题,亚马逊云科技此次推出了适用于 Amazon OpenSearch Serverless 的向量引擎,该向量引擎能够支持简单的 API 调用,可用于存储和查询数十亿个 Embeddings(将高维度的数据映射到低维度空间的过程)。亚马逊云科技还表示,未来所有亚马逊云科技的数据库都将具有向量功能,在AI数据层面成为开发者的“最强大脑”。

图片来自亚马逊云科技纽约峰会

图片来自亚马逊云科技纽约峰会

除了向量引擎的支持,在算力层面,亚马逊云科技也一直致力于构建低成本、低延迟的云上基础设施。

亚马逊云科技和英伟达合作已超过12年,为人工智能、机器学习、图形、游戏和高性能计算等各种应用提供了大规模、低成本的 GPU 解决方案,在交付基于 GPU 的实例方面拥有无比丰富的经验。此次,亚马逊云科技展示了最新基于英伟达 H100 Tensor Core GPU 提供支持的P5实例,能够实现更低的延迟和高效的横向扩展性能。

P5 实例将是第一个利用亚马逊云科技第二代 Amazon Elastic Fabric Adapter(EFA)网络技术的 GPU 实例。与上一代相比,P5实例的训练时间最多可缩短6倍,从几天缩短到几小时,这一性能提升将帮助客户降低高达40%的训练成本。借助第二代 Amazon EFA,用户能够将其 P5 实例扩展到超过 2 万个英伟达 H100 GPU,为包括初创公司、大企业在内的所有规模客户提供所需的超级计算能力。

降低生成式AI门槛,用产品最大化赋能用户

除了面向生成式AI开发的工具和平台之外,在企业的日常运营之中需要一些能够拿来即用的生成式AI产品,来帮助提升工作和管理效率。关于这一点,亚马逊云科技也陆续推出了一些在工作场景中直接可以使用的产品,这些产品既覆盖底层开发人员也关注到了企业中大量的非技术人员。

比如在代码开发领域,自从亚马逊云科技在去年6月首次推出AI编程助手Amazon CodeWhisperer之后,现在该功能已经成为了很多开发者日常必备工具之一。

Amazon CodeWhisperer基于几十亿行开源代码训练,可以根据代码注释和现有代码实时生成代码建议,另外还能进行安全漏洞扫描。目前支持包括 Python、Java 和 JavaScript 15 种编程语言和包括 VS Code、IntelliJ IDEA、JupyterLab 和 Amazon SageMaker Studio等集成开发环境。

为了进一步提高开发效率,在纽约峰会上,亚马逊云科技正式宣布 Amazon Glue Studio Notebooks 也能支持 Amazon CodeWhisperer。通过 Amazon Glue Studio Notebooks,开发人员可以用自然语言编写特定任务,接着Amazon CodeWhisperer 可以直接在 Notebooks 中推荐一个或多个可完成此任务的代码片段,供开发人员直接使用和编辑。

Amazon CodeWhisperer支持语言和环境,图片来自亚马逊云科技官网

Amazon CodeWhisperer支持语言和环境,图片来自亚马逊云科技官网

而对于非开发类工作场景,通过将 Amazon Bedrock的大语言模型能力与支持自然语言问答的 Amazon QuickSight Q 相结合,为用户提供了基于生成式AI的商业智能新服务。

比如你是一个财务分析师,你可以像跟ChatGPT聊天一样用自然语言下达命令,在几秒钟内Amazon QuickSight Q就能完成搜索关键财务信息或创建公司财务可视化图表的操作,同时还能帮你总结出趋势特点并提出建议。

类似拿来即用的产品还有帮助企业打破内部信息孤岛、加快数据驱动决策的Amazon Entity Resolution,以及能够帮助医疗软件供应商便捷地构建基于生成式AI的临床应用程序的Amazon HealthScribe等等,在各行各业扩大着生成式AI产品的使用场景。

释放AI时代的“云力量”

生成式AI的发展需要云,更需要大量基于云的工具和服务。

大模型之后,下一阶段生成式AI技术一定会朝着多样性和个性化方向发展,我们既可以看到比较通用的生产力工具,也会看到各种瞄准特定场景的AI产品。而在这个过程中,云平台会起到越来越关键的作用。

一方面,云平台会大大降低AI应用开发的门槛。在平台的算力和基础模型支持下,开发者们基本无需关心硬件和基础设施的问题,从而把更多的时间和精力放在业务和运营上。另一方面,云平台能够持续加快AI应用的开发和运营效率。用户可以通过直接调用API的方式进行应用的开发和管理,并安全、便捷地在团队或组织之间共享。

在云平台的助力之下,未来的生成式AI将不再只是一场巨头才能玩的烧钱游戏,更多普通人也将可以坐上牌桌。

作为云服务领域的行业领导者之一,亚马逊云科技提供了200多种服务,涵盖了计算、存储、数据库、网络、开发者工具、安全、分析、物联网、企业应用等广泛领域,云基础设施覆盖全球。同时,亚马逊云科技还是人工智能和机器学习领域的领先者,多年来持续提供和更新着一系列端到端的AI相关服务,让开发者可以灵活、便捷、低成本的开发和部署生成式AI应用。

此次,亚马逊云科技发布生成式AI工具“全家桶”,其核心目的就是要进一步降低生成式AI开发的门槛,让更多不懂大模型、不懂人工智能的普通人也能快速加入生成式AI的开发和应用之中。

生成式AI的重要性不在于模型有多大能力有多强,更重要的还是如何能够从基础模型演变成各个领域中的具体应用,从而赋能整个经济社会的发展。

现在,亚马逊云科技正在成为那个桥梁。

,站在风文件拒绝访问 口的生成式AI,离真正起飞还有多远?

相关:

谷歌研究团队利用GPT-4攻破AI审核系统DoNews8月2日消息,谷歌研究团队正在进行一项实验,他们使用 OpenAI 的 GPT-4 来攻破其他 AI 模型的安全防护措施,该团队目前已经攻破 AI-Guardian 审核系统,并分享了相关技术细节。AI-Guardian 是一种 AI 审核系统,能够检测图片中是否存在不当内容,及图片本身是否被其他 AI 修改过,若检测到图片存在上述迹象,便会提示管理员前来处理。谷歌 DeepMind 的研究人员 Nicholas Carlini 在一篇题为“AI-Guardia..

国足原主教练李铁被公诉中国国家男子足球队原主教练李铁涉嫌受贿、行贿、单位行贿、非国家工作人员受贿、对非国家工作人员行贿案,分别由湖北省赤壁市监察委员会、赤壁市公安局调查、侦查终结,移送检察机关审查起诉。经湖北省人民检察院指定,由咸宁市人民检察院并案审查起诉。近日,咸宁市人民检察院已依法向咸宁市中级人民法院提起公诉。

江宏杰杠上福原爱,业界预估前者已砸300万元新台币【环球网报道】据台湾《镜周刊》8月2日报道,台湾前乒乓球运动员江宏杰7月27日在日本召开国际记者会,指责前妻、日本前乒乓球运动员福原爱不遵守法院判决,以及恶意失联等行为。据报道,对于这场纠纷,业界预估江宏杰前后已砸300万元(新台币,下同)。据《体育日本》此前报道,福原爱与江宏杰2017年生有一女,2019年生有一男,2021年7月宣布离婚,当时双方称将共同监护两个孩子。不过,在今年7月27日的记者会上,江宏杰称,“7..

两部门:延续执行创业投资企业等有关税收政策至2027年底财政部 税务总局公告2023年第17号为进一步支持创业创新,现就创业投资企业和天使投资个人投资初创科技型企业有关税收政策事项公告如下:对于初创科技型企业需符合的条件,从业人数继续按不超过300人、资产总额和年销售收入按均不超过5000万元执行,《财政部 税务总局关于创业投资企业和天使投资个人有关税收政策的通知》(财税〔2018〕55号)规定的其他条件不变。在此期间已投资满2年及新发生的投资,可按财税〔2018〕55号文件..

河北涿州地库塌陷小区7人被直升机救出,其中包括4名幼儿极目新闻记者 满达受台风影响,京津冀遭遇强降雨,河北涿州水尚仁佳小区地库塌陷遭洪水倒灌,小区居民求助称家中没水没电没气,食物告急(极目新闻此前报道)。8月2日,极目新闻记者获悉,公羊救援队航空队执行第五次孤岛救援任务,赶赴水尚仁佳小区救援,从该小区救出7名群众,包括4名幼儿。水尚仁佳小区地库塌陷图(图源:网络)水尚仁佳小区临靠北拒马河,该小区居民8月1日向极目新闻记者介绍,小区积水较深,楼房一层已被淹..

山东500名消防指战员紧急增援河北涿州防汛抢险近日,受到连续强降雨和上游洪水过境影响,河北涿州防汛形势严峻,山村被冲毁,小区被淹,十余万人受灾,人员被困的报警不断。8月2日中午,国家消防救援局启动消防救援队伍跨区域增援预案,调派山东省消防救援总队500名消防指战员、76艘舟艇增援河北,同时派出水域救援专家组赴河北涿州指导救援工作。8月1日,河北省消防救援总队根据汛情发展,跨区域调派石家庄、唐山、邯郸、衡水、邢台、沧州6个消防救援支队543名消防救援人员..

媒体:央行明确调整存量房贷利率,为何要调?该怎么调?市场化、法治化央行再度谈及调整存量房贷利率,释放重磅信号!8月1日,央行、外汇局召开2023年下半年工作会议,在部署下半年工作时明确提到,指导商业银行依法有序调整存量个人住房贷款利率。有分析师测算,当前存量房贷的规模高达38.8万亿元。面对如此大规模的房贷,利率究竟该怎么调呢?今年7月的一场新闻发布会上,央行货币政策司司长邹澜表示:按照市场化、法治化原则,我们支持和鼓励商业银行与借款人自主协商变更合同约定..

俄罗斯素食网红去世,年仅39岁,曾把榴莲当成主食7月21日,俄罗斯素食网红詹娜·萨姆索诺娃在东南亚不治身亡,年仅39岁。萨姆索诺娃在社交平台上的账号名为“詹娜 D'Art”。她做素食网红已有10年时间,拥有百万粉丝。她的母亲告诉俄罗斯媒体,萨姆索诺娃当时有类似霍乱的症状,上吐下泻。而出现这样的情况很有可能是纯素食饮食习惯,加剧了身体疲惫。萨姆索诺娃做素食网红之初,也会补充鱼肉蛋奶,但最近的四五年,她几乎只吃水果、葵花籽芽,或是喝果汁和水果沙冰。一名朋友数..

韩国去年人均GDP同比减少8.2%,降幅排主要国家前三据韩国国会企划财政委员会议员陈善美8月2日基于韩国银行(央行)资料发布的一份统计数据,韩国去年人均国内生产总值(GDP)为32142美元,同比减少8.2%,减幅在47个主要国家中排名第三。据韩联社8月2日消息,47个主要国家包括全球30大经济体和经合组织(OECD)成员国,韩国人均GDP减幅仅次于日本(-15.1%)和瑞典(-8.5%),位居第三。从GDP数值排位来看,韩国去年人均GDP在47个国家中排名第23位,与2021年持平。按国家看,卢森堡..

俄无人机袭击对乌多瑙河港口伊兹梅尔造成“严重”破坏【环球网快讯】据英国《卫报》8月2日援引路透社最新消息,俄罗斯无人机袭击对乌克兰多瑙河港口伊兹梅尔造成“严重”破坏。