华为的大模型终于来了,我的评价是:相当震撼

2023-07-08 09:06:17 来源:网络

老被人说在大模型竞赛中掉队的华为,这次终于带着它的家伙事儿来了。

这不,在昨天的华为开发者大会 2023 上,华为就狠狠地秀了一把。

将近三个小时的发布会,还是继承了华为以往大杂烩的风格,看得世超是眼花缭乱。

不过,总结下来其实也就突出了一个主题:盘古大模型 3.0 。

其实就在前几天,当别的大模型还在比各种评分的时候,盘古靠着世界顶级期刊 Nature 认证的金字招牌,以一种别具一格的方式进入了大家的视野。

据说,加入了盘古大模型,气象预测的速度提高了 10000 倍以上,几秒钟就能出结果,台风打哪来,几点来,啥时候走,都能给你预测得明明白白的。

最主要的是,它的预测精度甚至超过了号称全球最强的欧洲气象中心的 IFS 系统,算是头一个 AI 预测赢了传统数值预测的产品。

要知道,以往的 AI 气象预测多是基于 2D 神经网络开发,但气象这玩意实在是太复杂了,2D 着实有点儿吃不消。

而且,之前的 AI 模型会在预测的过程当中不断累计迭代的误差,容易影响到结果的精确性。

所以 AI 预测方法一直都不咋受待见。

而盘古气象大模型牛就牛在,他们用了个叫 3DEST 的三维神经网络来处理气象数据, 2D 干不了的那就换 3D 来。

3DEST 的网络训练和推理策略

针对迭代误差的问题,模型还用了个 “ 层次化时域聚合策略 ” 来减少迭代误差,从而提高预报的精度。

这词儿虽然听起来挺容易被唬住的,但其实很好理解。

就比如,之前的 AI 气象预测模型 FourCastNet ,在台风来之前,它会提前 6 小时进行预测,在这 6 个小时里,模型会多次计算台风到底啥时候来。

可能一会儿算出来 5 个小时,一会儿又算出来 4 个半小时,这些结果加到一起误差就大了。

但盘古气象大模型想了个法子,训练了 4 个不同预报间隔的模型,分别是 1 小时迭代 1 次,还有 3 小时、 6 小时和 24 小时迭代 1 次。

再根据具体的气象预测需求,选择相应的模型进行迭代。

就比如说,咱们如果要预测未来 7 天的天气,那就让 24 小时的模型迭代 7 次;预测 20 个小时就是 6 小时的模型迭代 3 次 +1 小时的迭代 2 次。

迭代次数越少,误差也就越小。

这波操作,让天气预报又迈向了一个新的 level 。

不过,可能有差友开始犯嘀咕了,人家的大模型都是生成图像和文字,怎么到华为这就变成了天气预报了?

有一说一啊,这盘古大模型跟咱之前接触到的 ChatGPT 、 Midjourney 的确不太一样,人家做的是行业的生意。

简单来理解,就是盘古大模型咱个人一般用不上。

它并不是大家期待的 ChatGPT“ 克星 ” ,而是针对平时不太能接触到的To B 市场。

咱先不提难与不难,至少华为这么多年积累下来的企业客户资源,确实很容易变现。

而且华为这次的发布会可不止带来了气象预测模型这一个狠角色。

40 多年都没发现新的抗生素,盘古药物分子大模型一来就找着了超级抗菌药 Drug X ,而且药物的研发周期从数年缩短至几个月,研发成本降低 70% 。

盘古矿山大模型也能深入到采煤的 1000 多个工序之中,而且光是里头挑选精煤的这一个环节,就能让精煤回收率提升 0.1% 到 0.2% 。

要知道,一家年产 1000 万吨焦煤的选煤厂,每提升 0.1% 精煤产率,每年就能多 1000 万的利润。

这可都是白花花的

银子啊。。。

事实上,除了上边儿咱提到的天气预测、药物研发和选煤,盘古大模型在很多行业里都已经用起来了。

发布会上,华为云人工智能首席科学家田奇就表示,华为云人工智能项目已经应用在了超过 1000 个项目中,其中 30% 用在客户的核心生产系统里,平均推动客户盈利能力提升了 18% 。

而华为能够量产这些各不相同的行业大模型,要归功于华为盘古大模型 3.0 的 5+N+X 三层架构。

正是这种结构,让盘古能够快速落地到各个行业里。

为什这么说呢?

因为 AI 落地行业,数据是一大难点。

张平安在发布会上就说, “ 由于行业数据获取难,技术与行业结合难,大模型在行业的落地进展较慢。 ”

而盘古则很巧妙,通过 5+N+X 的三层架构,直接把这个大难题拆成了 3 个小问题来解决。

首先,是先让盘古 L0 层的 5 个大模型,学习了上百 TB 的百科知识、文学作品、程序代码等文本数据,以及数 10 亿张带文本标签的互联网图像。

咱们可以理解为,先让第一层 L0 的大模型( 自然语言大模型、视觉大模型、多模态大模型、预测大模型、科学计算大模型这 5 个基础大模型 )建立起基本的认知,也就是有点像咱们大学前的素质教育阶段。

然后,在第二层 L1 中的模型,则是让 L0 中的某一个基础大模型学习 N 个相关行业的数据形成的。这就像大学的本科阶段,需要选择各种专业去学习。

打个比方,医院里的 CT 影像检测跟工厂的图像质检虽说用的都是视觉大模型。

但毕竟一个是医院,一个是工厂,使用场景完全不一样,光靠基础大模型那肯定行不通,但如果把行业数据加进去,可能就有惊喜了。

最后的 L2 ,则类似研究生,会在具体行业的基础上再细化到某个场景。比如在仓储物流行业里,货物的运输、入库、出库可能都需要用到不一样的部署模型。

与此同时呢,华为还在里头加入一个反馈环节,有点进公司实习内味了。

根据他们的说法,过去开发一个 GPT-3 规模的行业大模型,通常需要 5 个月;而有了这套东西,开发周期能缩短至原来的 1/5 。

同时很多行业数据集小的限制也能被解决。比如造大飞机这种很细很细的行业,也能有大模型。

除了这一套大模型,华为这次还提出了个非常有意思的东西——算力国产化。

众所周知,咱们在 AI 算力方面,确实是比较尴尬。

一来, AI 行业的核心设备英伟达的 H100/A100 咱们买不到,二来,即使英伟达 “ 贴心 ” 出了平替 H800 ,但是也有所保留。比如,在传输速率上就砍了不少。

在大模型动辄几个月训练时间的背景之下,这就很容易被算力更强的国外同行弯道超车。

而这一回,针对这个问题,华为还是掏了些真家伙出来的。

比如,在纸面性能上,华为的昇腾 910 处理器已经够上了英伟达 A100 。

不过实际应用起来,还是有一些差距的。而且 A100 这也不是英伟达的终极武器。

但是,昇腾已经受到了不少友商的认可。华为甚至在发布会上,直接表示 “ 中国一半大模型的算力都是由他们提供的 ” 。

当然,华为这会儿在算力上的亮点,更像是整个软件生态带来的。

比如,根据发布会的说法,算上 AI 昇腾云算力底座、计算框架 CANN 。。。等环节,华为在训练大模型方面,效率是业界主流 GPU 的 1.1 倍。

还有,他们给用户制定好了全套的应用套餐。

例如,美图仅用 30 天就将 70 个模型迁移到了华为生态。同时华为还表示,在双方的努力下,AI 性能较原有方案提升了 30% 。

还是挺可观的。

而且华为还说,他们现在有近 400 万的开发者,这个数量,是和英伟达 CUDA 生态对齐了。

这一系列的动作,算是把短板补上了一部分

总的来说,一场华为发布会看下来差评君觉得华为在 AI 方面的布局是很深刻的,他们早就开始思考 “AI 真正能带给我们什么 ” 这个问题了。

过去半年里, AI 行业虽然掌声雷动,但是真正落到行业层面,多少有些尴尬。

而华为的这一次动作,恰好印证了如任正非说的:

“ 未来在 AI 大模型方面会风起云涌的,不只是微软一家。人工智能软件平台公司对人类社会的直接贡献可能不到 2% , 98% 都是对工业社会、农业社会的促进。 ”

AI 领域,真正的大时代还在后头。

撰文:糖醋排骨&及格 编辑:江江&面线 封面:焕妍

,华为的西瓜的英文 大模型终于来了,我的评价是:相当震撼

相关:

亮警官证干扰查酒驾,徐科长到底给谁打了电话\n 有很多领导干部倒在了酒驾之下,所以现在都形成了共识,就是开车不喝酒,喝酒不开车。但就是在如此严格的执法之下,却还是有人能够逃脱制裁。昨日网上流传着一段全长四分钟的视频,河南郏县交警日常在路口设卡查酒驾,有一辆白色轿车却拒不接受酒精吹气测试。后座的乘车人慢慢地摇下窗户,同时掏出警官证质问交警,“这能走不能?你们带班是谁?”不过交警并没有放行,而是要求这名男子下车,在这个过程中,男子口中一直询问..

《消失的她》能鉴别渣男吗?· 这是第5282篇原创首发文章 字数 3k+ ·· 臧否 | 文 关注秦朔朋友圈 ID:qspyq2015 ·电影《消失的她》上映两周票房突破25亿元人民币,眼看就要进入“30亿+俱乐部”,无可争议地成为当季爆款。和大多数突围成功的国产片一样,《消失的她》在票房一路疾驰的同时,遭遇了口碑的两极分化,喜欢它的人说它“配享太庙”,讨厌它的人说它“加剧对立”,两边的用词都未免夸张,不得不令人惊异一部内容产品的能量。先说优点..

撞坏海警船,设置钢刺阻止登检,渔船暴力抗法被查!(图)7月5日,中国海警局东海分局成功查缉1艘暴力抗法违规渔船,抓获嫌疑人9人。△海警执法员成功登临控制嫌疑船当日,中国海警局东海分局舰艇开展重点海域执法巡航任务时,在广东汕头东南约65海里海域发现一艘违规拖网作业渔船。2艘海警舰艇随即靠前,要求其停船接受检查,但该渔船拒不接受指令,以10至12节航速反方向逃离。其间,该渔船多次抛投渔获物、渔网并割断船尾拖网企图毁灭证据。海警舰艇在采取政策规劝、航路管制等措施无..

乌克兰战争,美国的“道德制高点”在失去美国已经决定向乌克兰提供极具争议的集束炸弹,《纽约时报》称,这似乎会让美国失去道德制高点。“尽管前白宫新闻秘书去年表示俄罗斯使用集束炸弹是‘战争罪’,但美国已决定向乌克兰运送集束弹药,以帮助其军队击退在前线盘踞的俄罗斯军队”,英国《每日邮报》7日称, 自去年12月以来,拜登政府一直在权衡是否提供集束炸弹,现在决定已经做出,预计将在7日宣布将提供数千枚集束炸弹,作为价值8亿美元的新的军事援助计划的一部..

北约包藏的对华祸心,被立陶宛提前暴露了北约下周要在立陶宛维尔纽斯召开峰会,作为主办国的立陶宛显得既兴奋又迫不及待,但它却把这股情绪的相当一部分体现在对中国进行挑衅上,其他几个北约成员国也在涉台方向上有所联动。这些都提前暴露出本届北约峰会对中国所包藏的祸心,容不得中国人不多想并提高警惕。在峰会召开前一周左右,立陶宛学着美国公布了它的所谓“印太战略”,这份仅有16页的“战略”最受关注的内容就是对台湾问题的表述,强调发展与台湾的经济关系是立..

世界银行前行长:美国无法遏制中国发展近日,世界银行前行长罗伯特·佐利克在接受《华盛顿邮报》采访中表示,冷战是一个非常草率的比喻。当下从实力的角度看,美国无法遏制中国发展。

李强总理的比喻,耶伦听懂几分?7月7日下午,国务院总理李强在北京人民大会堂会见美国财政部长耶伦。图源:新华社直新闻:国务院总理李强今天在会见美国财长时,特别谈到耶伦昨天抵京在机场抬头见彩虹的那张网红照,强调期待中美关系也能雨后见彩虹,管先生,你对此有何分析?特约评论员 管姚:大国总理见耶伦的开场讲话非常精彩,很温暖,很个性化,很接地气,还给出一个让全世界都印象深刻的彩虹妙喻,特别契合当下中美关系的承压现状与前景预期,一定程度上..

提前至8时!7月8日至8月31日故宫博物院开馆时间调整  7月7日,故宫博物院发布暑期预约参观提示。详情如下:   暑假期间(7月8日—8月31日),为方便广大观众来院参观,故宫博物院特此温馨提示:   1、开馆时间由8:30提前至8:00,逢周一闭馆(法定节假日除外)。   2、暑假期间,6周岁(含)以下或身高1.2米(含)以下未成年人无需预约,但须在已预约门票的成年人陪同下,核验入院。6周岁以上未成年人仍需预约。   3、为确保未成年人安全,14周岁以下未成年人须有成年人陪同..

澳门青年“做客”浙江 南来北往情谊绵长  中新网杭州7月7日电 (王潇婧)《七子之歌》《我爱你中国》《感恩的心》……6日晚,在由澳门苏浙沪同乡会、澳门浙商联合会举行的“同心迎亚运 携手向未来”港澳青年浙江(杭州)行活动答谢晚会上,约100位澳门青年用一首首耳熟能详的歌曲,向祖国深情告白。   “澳门始终坚持爱国、爱乡、爱家,也一直告诉澳门青年,要常怀一颗感恩之心,为爱国爱澳薪火相传而努力不懈。”澳门浙商联合会会长、浙江省侨商会会长廖春荣期望,..

新疆启动信息产业(互联网行业)专场招聘活动  中新网乌鲁木齐7月7日电 (记者 王小军)7月7日,“以智汇新疆 e职等你”为主题的新疆信息产业(互联网行业)专场招聘活动在乌鲁木齐市启动。   启动仪式当天,共有237家信息产业(互联网行业)企业参加专项招聘活动,涵盖电子商务、互联网金融、网络安全、电子信息、软件开发、物联网、大数据、网络通讯等。其中,现场参会企业125家,共提供岗位7034余个,进场求职7300余人,初步达成就业意向1218人(次);线上直播间参会企..