干货 | 2 分钟论文:语音生成表情包背后的技术原理

2017-12-11 19:03:02 来源:网络

原标题:干货 | 2 分钟论文:语音生成表情包背后的技术原理

雷锋网AI 科技评论出品系列短视频《 2 分钟论文 》,带大家用碎片时间阅览前沿技术,了解 AI 领域的最新研究成果。

来源 / Two Minute Papers

翻译 / 郭维

校对 / 凡江

整理 / 雷锋字幕组

【本期论文】

AI Creates Facial Animation From Audio

由语音生成实时面部表情动画

雷锋网本期论文探讨的话题是 —— 由语音生成实时面部表情动画,也就是说,在对我们说的话进行语音记录后,通过某种学习算法,生成数字形象在说话的高质量动画。听起来是不是很酷呢?

实际上,这种学习算法是一种卷积神经网络。每个角色只需要进行三到五分钟的训练,便可以对真实世界的各种表达方式及语言形成某种概念。如果你认为,这没什么大不了的,实际上,这个算法在不断地优化过程中,变得越来越好。

接下来我们会聊到,背后主要有两个原因支撑这个算法的不断优化。

第一个原因就是,它不仅将音频作为输入,我们发现在说出这些话的时候,角色所处的情绪状态也得到了表达,从而变得栩栩如生,非常生动。

第二个原因,也是最棒的一部分,我们可以将此与 DeepMind WaveNet 相结合,通过文字输入合成音频。因此,它基本可以合成一个真人语音,并且将我们写下的任何东西,毫无障碍地讲出来。听起来似乎我们可以同时应用剪辑与这项技术,使得数字形象说出我们写下的内容。

那么通过 WaveNet 我们是否可以将文字转化成语言,并将语音加到真实角色上去呢?这样一来,我们找到了一种通过学习,为我们方便地提供服务,甚至不再需要任何画外音演员,也不再需要为动画进行动作捕捉,实在是太棒了。

雷锋网提醒在该篇论文中,尤其需要注意的是,作者提到的用于确保结果长期正确运行的三向损失函数。当然了,在研究中我们必须证明成绩是在不断提高的。在补充视频中,我们做了很多对比来完成此项内容,但是我们需要的,不仅仅是这些。

由于这些结果无法归结为我们需要证明的数学定理,我们不得不采取其他方式来完成这件事。最终的目标是,普通人认为这些视频是真实视频的几率,要比用原先技术生成的视频的大。这是该篇论文中提出的用户学习的核心理念。

我们找来一群人,在他们不知情的情况下,给他们观看新老技术所生成的视频,然后问他们觉得哪个更加自然,结果相去甚远。新技术不仅整体上有优势,在某个单项中,不论是场景还是语言上无不胜出,这在研究中是很罕见的。

一般来说,在一个成熟领域,新技术只是进行了不同的取舍。一个经典的例子就是——执行时间的减少伴随着内存消耗成本的提高。然而在本篇论文中,它在各方面都体现了出了优势,让人惊叹。

学霸们还请自行阅读论文以获得更多细节

,干货 | 2 分空间解析几何 钟论文:语音生成表情包背后的技术原理

相关:

先别管自动驾驶 特斯拉的下一个目标客户其实是火星人原标题:先别管自动驾驶 特斯拉的下一个目标客户其实是火星人 上周,伊隆·马斯克向外媒正式宣布,会在2018年,将自家的特斯拉跑车Roadster,用Space X的Falcon Heavy火箭,送上到火星。不过,科技网站The Verge对马斯克的计划提出了质疑,随便把一台车扔到太空上,真的可以吗? 依照马斯克特立独行的个性,让火箭带东西,是他的惯例。2010年当Dragon发射时,马斯克就在里面塞了一块奶酪。 这一次,他对于将特斯拉R..

游戏宅必看 斯皮尔伯格的VR主题大片都有这些“过气网红”原标题:游戏宅必看 斯皮尔伯格的VR主题大片都有这些“过气网红” 讲道理,如果光是因为和游戏沾点边,就要让我这种游戏宅愿意掏钱去影院坐上两个多小时,也不是那么容易的。之前的一部《无敌破坏王》够隐喻够内涵,也没有让很多游戏死宅真正地走出自己的那方小天地,难道是因为梗不够多?斯皮尔伯格的《玩家一号》就给你塞点简单粗暴的,暴力玩梗最为致命。 《玩家一号》由Ernest Cline的同名小说改编,主要讲述了名为..

黄牛们欲哭无泪要跳楼 iPhone X售价历史新低原标题:黄牛们欲哭无泪要跳楼 iPhone X售价历史新低 中关村在线消息:iPhoneX国行256GB版本京东9288元,虽然相比原价9688元仅仅便宜了400元,但9288元的价格拿下256GB版本还是相当值的。 iPhoneX自11月4日上市以后就遭到用户们疯抢,黄牛们则是见有空子可钻开始纷纷囤货,据说当时的X鱼等交易网站都曾加价300-500出售。随着产能的提升,目前苹果中国官网iPhoneX的发货期已经缩短为1-3个工作日。 iPhoneX历史新低 此前..

上周新增4家报会企业 年内累计新增351家   交易所数据显示,上周(12月4日—12月8日)新增4家报会企业,其中上交所2家,深交所中小板2家。截至12月8日,今年新增351家报会企业,其中上交所149家,深交所202家(中小板45家,创业板157家)。 (责任编辑:DF062)

魅族双12大促预告 PRO 7最高直降600元全年最后一次促销狂欢季双十二马上就要到了,商家整装待发,消费者摩拳擦掌,一场蓄势已久的大战一触即发。今天,魅族发布了双十二促销预热海报,旗舰机型PRO 7系列最高直降600元。此次魅族年终大促,堪称史上最给力优惠活动, 活动将于12日凌晨0点正式拉开帷幕。用户可在魅族官方商城、天猫、京东、苏宁、国美、迪信通、乐语、魅族全国认证专卖店及社会网点等线下渠道购买。“花更少,添更多”,没赶上双十一优惠活动的、筹备年..

速抢!元旦火车票将开卖!就在明天!预售期恢复30天!2017年剩下不到一个月了别光盼着假期的到来还有几件事千万别忘了!比如抢元旦出行的火车票~11月27日12306网站发布公告通知,由于铁路部门对旅客列车运行图进行调整优化,因此临时调整车票预售期。自11月27日起只发售12月25日(列车始发日期)及以前的车票。最新消息!全国铁路新运行图编制工作已全部完成自12月12日起,全国主要干线旅客列车车票互联网、电话订票预售期恢复30天,详情请见各铁路局和车站公告。周二起就能抢元旦火..

中国创客领袖大会:侠之大者,为国为民1000年前的大侠,言必行,行必果,己诺必诚,不爱其躯,赴士之阨困,以国家的生死存亡为己任,适逢有可以作为之时,必定身当前驱,不畏险阻困苦,以内心的侠义道德,成就一段荡气回肠的历史; 100年前的大师,于乱世之中坚守师之大者的精神与责任,开各领域风气之先,在动荡混乱的年代,保持独立的人格、自由的精神,其思想在当时引领着众多为国家振兴而不断奋斗的仁人志士,在灰暗的社会中保留一方澄净; 今天的商界创客..

“亚洲蹲”刷爆朋友圈:终于知道真相了最近,朋友圈被“亚洲蹲”(Asian Squat)这个动作刷屏了。 “亚洲蹲”其实指的是深蹲,屁股、膝盖和脚踝完全弯曲,而且脚跟要贴地。神奇的是,大部分亚洲人能够毫不费力地蹲下,但是一些外国人就不行。这是为什么呢?网传可能是与不同人种的身体构造有关,也有人猜测是与生活习惯相关?这些猜测都站得住脚吗?一起分析一下。 什么是“亚洲蹲”?“亚洲蹲”来源于美国人发明的功能运动质量测量方法(Functional MovementScreen,..

为什么泡面一定要泡3分钟?原来我们一直都被骗了!世界上最漫长的三分钟莫过于给泡面冲完开水之后,等待中那煎熬的三分钟。泡面包装上的使用方法总是建议用水煮,或是以热水冲泡,只要3分钟即可食用。那么,吃泡面为何要等3分钟?有些面明明泡5分钟或者更长的时间味道也很不错,面条仍然爽滑。难道多年来我们一直都被忽悠了吗?其实,所谓的“3分钟”,是发明泡面的创始人确定的。1958年,日籍台湾人安藤百福在大阪府池田市发明了方便面。他在之后不断试验产品推销产品的过程里,..

中国设计红星奖最高奖花落北京 设计领域涌现“北京力量”原标题:中国设计红星奖最高奖花落北京 设计领域涌现“北京力量” 2017年12月11日讯,(记者 张然)日前,2017中国设计红星奖颁奖活动以“设计让生活更美好”为主题,在北京天桥艺术中心举行。今年红星奖的最高奖“至尊金奖”花落北京,由北京牛电科技有限责任公司报送的“小牛电动车M1”摘得此桂冠。 国际评委在查看设计红星奖参评产品“小牛电动车M1”,这款由北京企业报送的产品获得了今年中国设计红星奖的最高奖..