Alexa的印度“荒野大挑战”

2017-11-29 15:27:23 来源:网络

原标题:Alexa的印度“荒野大挑战”

雷锋网按:亚马逊的闪耀新星Alexa近日登录印度,这是继德国美国英国之后Alexa即将征战的第四片土地。在此之前,Alexa 的支持语言只有英语和德语,相比之下,Google Assistant 已经支持 5 种语言,苹果 Siri 更是支持 24 种语言和 36 种方言。

原本在语言上就稍显落后的Alexa,此举可以说野心勃勃。根据 2001 年的统计,印度有 29 种语言的使用人口超过一百万,有 122 种语言的使用人口超过一万,除了英语和印地语两种全国性的官方语言之外,印度宪法认定的、在各个邦具有官方地位的语言还有 22 种。对于 Alexa 这样面向消费级用户和大众市场的语音交互产品来说,复杂的语言环境无疑是相当大的挑战。显然,Alexa在这里将直面它的终极挑战。它会一鸣惊人,还是遭受重大打击呢?

Factory Daily近日发表文章,深入阐述了Alexa登录印度所面临的困难,亚马逊为此所付出的努力,以及各方人士对此的看法。雷锋网在不改变原意的情况下,为您做如下编译:

 她现代化,会说流利的英语,能帮助您预订出租车,找烹饪食谱,播放你最喜爱的音乐,并被她最喜爱的演员沙鲁克汗(Shah Rukh Khan)所深深吸引。她是一位典型的印度女士,她可能回答你所有的问题。她最喜欢的女演员是Emily Stone和Rachel Weisz,最喜欢的冰淇淋味道是薄荷巧克力片。她是Alexa,出生在一个美国籍的亚马逊家族,说着一口带印度口音的英语。

她是被训练成这样的。 Alexa是亚马逊的语音助理,印度是它推出的第四个国家。亚马逊有雄心把Alexa放入一切场景。进入你的手机。进入你的车。进入你整个家庭。甚至进入酒店和办公室。

Alexa在美国、英国和德国取得了一些早期的成功。世界各地有几十家公司把Alexa嵌入了它们的产品。在国际消费电子展上,福特、大众和奥迪展示了将Alexa嵌入仪表板的汽车。

连接到互联网后,Alexa会试图回答你的问题,遵照你的命令。但印度将是Alexa的终极考验。 “语音助手在单语或双语国家运作良好。但印度是不同的。”Lattice Bridge Infotech(简称LBIT)的总经理Mohan Ram说,他自2001年以来一直从事语音识别技术领域。 

2001年刚开始的时候,Ram告诉投资者,他的公司将在五年内解决卡纳塔克邦的语言和方言问题。但是17年以来,他承认他只解决了80%的问题。他说:“每隔100公里语言就会变化,每30公里方言就会变化。”但他同意人工智能、机器学习和深度学习将会很大程度上改善这些问题。亚马逊正在以此为筹码,试图解决印度的复杂性。
早在亚马逊在印度推出Alexa的一年多之前,它已经开始了培训,以满足当地的需求。“Alexa了解口语词汇及其背景。印度与其他单一语言国家不同的是,我们要使用大量专有名词——可能是一个人名,一个地方,一个宝莱坞唱片的名称,一个词作者或一部电影。”Puneesh Kumar说,他是 Alexa体验与设备在印度的区域经理。
Kumar自2010年5月以来一直在亚马逊工作。最初是实习生,然后在亚马逊中国担任高级项目经理,并在亚马逊在中国市场推出期间工作。他最长的时间是作为亚马逊全球销售计划的总经理,工作了两年半,一直到领导Alexa在印度的实践之前。 

“我们不得不跳出英语思维的框架之外去思考。 我们要训练Alexa了解泰米尔语,印地语,泰卢固语,旁遮普语,马拉雅拉姆语中的专有名词。”Kumar说,他现在在加罗尔工作。

这些问题对印度来说是独一无二的,即使别的国家也有多种方言。例如,坐落在卡纳塔克邦边上的城市贝尔高姆,它从孔卡尼语、马拉地语和卡纳达语的混合中发展出了自己的语言。距离贝尔高姆386公里的乌杜皮,也是在卡纳塔克邦,那里的人们讲的语言是图鲁语,马拉雅拉姆语和卡纳达语的混合。

硅谷研究公司Constellation Research的首席分析师兼董事长Ray Wang表示:“鉴于印度人口众多,在这个国家分不同洲推出产品可能更好。” “亚马逊在能力上仍然落后于谷歌,但正在快速赶上。(成功)所需要的正是很多用户去测试和学习。”

 

Puneesh Kumar, Alexa体验与设备在印度的区域经理。

Alexa建立在人工智能和机器学习框架之上,可以在云端不断学习。亚马逊结合了云计算和人工智能的两项开创性技术,并以简单易用的语音作为用户界面入口。

Kumar说:“正是因为它机器学习的背景,因此每一句话都在帮助它学习。 Alexa基于自然语言理解(NLU),意味着基本上它能理解句子和上下文,并将其从文本转换为语音。这些情况因国家而异。在美国和英国,当人们谈论marks时,他们是指划痕。但在印度,marks通常是指成绩和分数。

Alexa也理解印度遵循着以十万和千万为单位的数字系统,而不是百万和十亿。 Alexa必须意识到这一点,Kumar说。它能识别UP(北方邦),MP(中央邦)和CM(首席部长)等缩写词。它也可以识别不同的PIN码。它还囊括了北印度词汇,如haldi,jeera和dhania,这些词不是英语单词,但是是常见的印度语单词。

为印度进行专项训练

准确的说,Echo设备的用户体验(Echo能即时连接到Alexa播放音乐,获取新闻和天气等信息,并使用语音控制智能家居)仍尚在发展中。FactorDaily加罗尔办公室对Echo询问“谁是Anand Murali”,得到了一个不正确的答案,而理想情况下它应该查询上下文,确定我们想问的是谁。 Google语音查询会在搜索结果的顶部显示Anand的LinkedIn(领英)个人资料。
Shonali Muthalaly在《印度教徒报》中写道,“这远非完美。”“Alexa仍在了解印度的过程中,所以当我要求她推荐餐馆、提供交通预测和路线推荐时,她回答的一团糟。”据推测,随着越来越多的印度人使用这个平台,结果会变得更好。
培训Alexa不容易,Kumar承认。亚马逊最初的语料集有限——大约有一万个。这被称为训练数据。Kumar不记得确切的数字了。然后有一种叫做测试数据的,它是无限的,是人类互动和万维网的混合体。
Kumar认为,Alexa尚不完美,所以只邀请了少数人使用。(此前亚马逊在印度当地挑选了一批公司高管和商务人士作为天使用户,将一部分 Echo 音箱赠送给他们试用。)随着越来越多的人进入Echo设备,Alexa将学习更多。“那时机器学习就大显身手了,并且开始识别训练数据中不存在的新东西......随着越来越多的人与设备交谈,语言会扩展。事情现在还不是应该有的样子,随着时间的推移会变得更好。”他说。
有一种叫做DWC(需求加权覆盖)的东西。是最受欢迎和最常说的词语列表。为了识别这些词语,Alexa寻找模式,声音,音素,背景,然后把它们放在一起,看看人们说的话可能是什么。一旦发现不匹配,则跟踪每个不匹配以改善体验。
早期时,Alexa知道Amitabh Bachchan是一名演员,甚至可以获取他的歌曲,但她会把Bachchan发音成Bakkan(遗漏了“chch”的发音)。随着时间的推移它在学习。Kumar说,Alexa要学习的大部分经验是用她的方式读出正确的方言和发音——不仅仅是英文,还有印度语和泰卢固语的流行词汇。 

 

Kumar说,如果Alexa能够理解对面的那个人,相当于得到了圣杯(最高奖赏)。 “无论如何,我们都希望Alexa了解话语背后的意图。我们根据意图来看大部分话语。”例如,播放歌曲,播放电影中的歌曲,播放带有某歌词的歌曲,或不使用播放这个词,给我唱首歌,帮我缓解一下心情——它们可能最终都要求Alexa获取相同的结果。Kumar说:“我们正尝试绘制相关性。”

如果用户在获取结果后的几秒钟内说“不”或改变询问,机器学习算法就会明白Alexa没有获取正确意图。即使这个输入只是用于训练。

亚马逊在训练Alexa时使用了机器学习和人工干预的混合,尤其是在同一个词有多个发音的时候。Kumar说:“我们得到的回应让人很有信心,然后我们用一个非常熟悉这个词的人做审查机制,以确保我们正确的理解了这些音素。”

但是不可能每次遇到这种词都这么做。Alexa会提取前20或30个词语进行这个过程,每当有一个这样的词语时,这个程序就会继续进行,这时候这个词语的表达水平已经更高了。

不过,Kumar说,这位女士(指Alexa)会有一个自己的声音,它不会随着从南到北的印度而变化,虽然亚马逊希望Alexa能够理解不同的文化、口音和对着麦克风说话的人的思维方式。 “我们看的是最终的综合声音。最终的声音是对机器,音素,词汇的调制,所有这些都以非常印度的声音进行预先录制,”Kumar说。

由于不可能录下每个词语,他们录制了一组词语创建了所谓的基本结构。 “我们采用了一个人声,然后把它与机器学习、语音和词典这些结合起来。我们把这个声音看作一个组合。”他说。

另外,因为一位女士(上文提到的人声的主人)不可能熟知所有的口音和语言,所以他们选择了多个人来录制。然而,在机器学习的帮助下,亚马逊已经成功地使Alexa的声音变得一致,无论你在印度的什么地方使用。 Kumar说:“在印度说话的Alexa会有一个自己的人格。” 

 “星际迷航”带来的灵感

第一天,在亚马逊完成语音助理Alexa在印度的全面推广之前,Alexa有10800个精确的技能。当Alexa在美国推出时,它只有13种技能。技能是基于语音的应用程序,如移动应用程序,它让用户能使用语音命令来操作应用程序。
亚马逊的Alexa语音服务和技能主管Steve Rabuchin告诉Wired,该公司受到了“星际迷航”电脑的启发——创建一个助手,让用户可以通过简单的语音命令来控制周围的一切。
亚马逊已经与印度的开发商合作,将流行的应用程序与亚马逊的语音助手整合在一起。对于旅行方面,有Ola,Goibibo,ixigo和Jet Airways。食物方面,有Faasos,Zomato,Freshmenu,Sanjeev Kapoor,达拉尔。音乐方面,有Saavn和Bollywood Hungama。运动方面,有ESPNCricinfo。新闻和教育方面有印度时报,NDTV,ABP Live,AajTak和Byju's。智能家居解决方案,他们拥有Syska和Silvan,UrbanClap和Housejoy则提供勤杂工服务。 

 

Kumar说,将Alexa与应用程序整合是很容易的。他说:“已经有年仅10岁的孩子建立起一门技术,还有年纪大又没有任何技术知识的人,他们也能够建立一门技术。

对于ixigo的首席执行官兼联合创始人Aloke Bajpai来说,Alexa是一个很好的传播平台。他说:“亚马逊非常非常雄心勃勃,我们期望他们能够在很短的时间内达到几百万台设备。

但Bajpai并没有将ixigo局限在Alexa上——他正在建立自己的语音助理Tara.“Alexa的使用是有限的...你问一些东西,然后它反应。它需要更积极主动,譬如如果一个长周末即将到来,它应该能够向你推荐一些东西,“Bajpai说,但是他同意,谷歌和亚马逊把重心放在语音助手之后,情况正在发生变化。他说:“语音合成得到了改善......在我们正在使用他们的API的基础上。”

在疯狂学习的同时,也有人为干预来塑造Alexa的人格。Kumar作为发言人在一封后续电子邮件中表示:“我们通过赋予Alexa特性属性和个人偏好来赋予她人格。“她对宗教是持不可知论的,政治上独立,同时是科学,技术,创新,多样性和社会进步的坚定支持者。”

Alexa可以成为女朋友还是忠诚的伴侣? Kumar说:“我们希望Alexa能够提供语音服务,成为陪伴者,并且可以在任何情况下你都可以与之交谈。 “如果你说'我压力很大',她会问你是否想听一些冥想音乐。”

,Alexa的印度“荒野大秘方 挑战”

相关:

爱彼迎出了个好用的工具,房费也能 AA 收款了原标题:爱彼迎出了个好用的工具,房费也能 AA 收款了 一群人一起旅行时,负责订酒店、交通的人大概是最苦逼的。别的不说,光是住宿费就是一大笔支出,收款都是一件让人头疼的事。但如果你习惯了在爱彼迎(Airbnb)上订房,这事以后会变得容易些。 爱彼迎最近推出了一个名为“Split Payments”的工具,可以让用户在下单后选择和朋友分摊房费,也就是我们常说的“AA 收款”。 用户在爱彼迎官网或 App 上预订房间时..

BAT齐聚智能音箱领域 创业公司成本价抢市场尽管云服务用的是阿里云,内容用到了腾讯的QQ音乐,也拿到过谷歌的投资,出门问问这家人工智能领域的新晋独角兽公司仍然需要和巨头抢时间。智能音箱的赛道已经是巨头云集。在刚刚过去的“双11”,阿里智能音箱“精灵”总销量突破100万台;11月16日,百度发布了首款智能音箱产品;而腾讯也正在赶来的路上。国外玩家中,上市三年多的亚马逊智能音箱Echo销量达到了1500万台;在美国市场份额排在第二位的Google Home也在全力追赶。在巨..

苹果与京东方洽谈 后者或成为iPhone面板供应商原标题:苹果与京东方洽谈 后者或成为iPhone面板供应商 最近有消息透露苹果正在与京东方洽谈,系为来由京东方提供iPhone手机的显示面板。 【PChome手机频道资讯报道】关注苹果手机的都知道今年的iPhone X中,苹果首次采用了OLED屏幕,在显示效果上要比以往更加的绚丽,但是同时这也让苹果受到了OLED面板供应商的限制。对此苹果自然要想办法解决,继苹果投资LG建立工厂后,最近有消息透露苹果正在与京东方洽谈,系为来由京..

谷歌陷舆论风波:你的Android设备可能正被监控原标题:谷歌陷舆论风波:你的Android设备可能正被监控 你的“隐私”里有什么? 【PChome智能硬件频道资讯报道】谷歌的“不作恶”信条称得上是企业文化领域教科书一般的案例,但近日,外媒对谷歌一项举动的曝光却令谷歌陷入了舆论风波中。 近日,据外媒报道,谷歌公司从2017年1月开始收集Android平板和手机用户的数据。根据用户距离最近的几个蜂窝数据信号塔的距离,谷歌就可以进行相应的位置定位,即使用户关闭了定位..

《轩辕剑之汉之云》发放更新福利 与观众不见不散张云龙关晓彤对于所有被《轩辕剑之汉之云》撩到的玄幻迷们来说,东方卫视本周三播出的第42集,绝对是不容错过的“精彩一集”。不少观众和网友早早就在剧集官方微博下留言,纷纷想知道焉逢有没有康复,横艾有没有冲破磬儿的结界,来找她的心上人焉逢。在42集当中,焉逢咬牙切齿的表示,要杀掉暮云,以洗掉自己身上背负的冤屈。他们兄弟两个会在最新的剧情当中成为生死仇敌么?会正中坏人的下怀继续反目成仇么?答案即将在东方卫视..

《儿科医生》热播 曾黎凌潇肃初恋CP被唤复合曾黎饰叶梅近日,由罗云熙、孙铱、曾黎、凌潇肃主演的都市医疗剧《儿科医生》正在山东卫视热播,该剧以“都市剧”为外形,以“医疗剧”为内在,以“情感剧”为调剂,以“励志剧”为核心,讲述了儿科医生们的日常状态,有爱情,有友情,让儿科医生的形象在观众心中更加深刻,拉近了医生与观众之间的距离。叶梅(曾黎饰)与褚子健(凌潇肃饰)多年的爱恨情仇也同样备受关注。《儿科医生》讲述了儿科医务工作者在救助患者抢救生命的..

《演员的诞生》飞行导师陶虹自带“仙气”登场陶虹在《演员的诞生》舞台近日,浙江卫视《演员的诞生》曝光了第六期节目的预告片花。视频中,节目除了迎来了黄圣依、于明加、柴碧云姐妹联手带来《我和春天有个约会》,张雪迎、侯明昊、姚远、冯文娟4人组合上演《将爱情进行到底》,陈龙、彭昱畅、李泽锋则实力挑战《解救吾先生》,此外,飞行导师陶虹也自带“仙气”实力上线,一出场便令导师宋丹丹止不住地鼓掌发出惊叹,而章子怡更是直呼:“仙女下凡。”前来挑战的演员舞台..

李宇春周笔畅同台 “夫妻档”领衔演技派助阵尖叫之夜李宇春近日,2018爱奇艺尖叫之夜接连曝光了四波嘉宾阵容,盛典还未开启就已吸引了不少网友的热切关注。正当大家纷纷猜测还有哪些大牌明星的加入时,爱奇艺又强势曝光了两波艺人名单。此次名单中,既有李宇春、迪玛希、艾福杰尼、黄旭这些能燃爆现场的人气唱将,也有徐帆、范伟、吴刚、岳秀清等实力派“老戏骨”,而冯小刚、白一骢、苏芒等业内大佬的现身则会让你感受到这场顶级娱乐盛宴的行业聚合力。艾福杰尼李宇春、周笔畅时隔..

菅纫姿坦言《猎场》压力大到掉眼泪 演完变强大菅纫姿饰演罗伊人郑秋冬(胡歌饰)和罗伊人(菅纫姿饰)的感情一直牵动着万千观众的心,由菅纫姿主演的2017热血逐梦纵横职场年度压轴钜制《猎场》正在湖南卫视金鹰独播剧场热播中。菅纫姿饰演的罗伊人因为与郑秋冬之间有着剪不断理还乱的情感纠葛,一直是网友们热议的焦点。近日,菅纫姿接受了媒体采访,对于罗伊人这个角色说出了自己的理解,并直言罗伊人和郑秋冬才是真爱。菅纫姿自曝担任《猎场》女主压力山大曾沉浸在角色中偷..

《生逢灿烂的日子》霸屏 张嘉译驼背原因惹人心疼张嘉译剧照近日,怀旧都市情感剧《生逢灿烂的日子》网播量破亿,观众好评如潮,网友也助力该剧一度拿下豆瓣8.7的高分。这部霸屏的“胡同大戏”,将镜头聚焦70后和小人物,还原大时代背景下一代人的成长轨迹。在大时代的发展和变迁中,胡同里的郭氏四兄弟,事业、爱情都面临着前所未有的考验。剧中,戏骨张嘉译演技爆发受到网友的追捧,但细心的网友可以发现现在的张嘉译略有驼背现象,背后的真相令人心疼。聚焦小人物成长,张嘉..