AI能忆起昨天的你了 但触景生情还有点难

2019-12-17 14:41:07 来源:网络

  AI能忆起昨天的你了 但触景生情还有点难

  人工智能要形成长期记忆,还需要脑科学、神经科学、心理学和行为经济学等多学科的交叉研究。

  记住一些东西并能回忆起来,对于人类来说是与生俱来的能力。记忆可以让我们回忆过往之事,并基于此对未来做出决策。能否让AI智能体也做到这点呢?近日,谷歌旗下人工智能企业“深层思维”(DeepMind)提出一种方法,能够让智能体使用特定的记忆来信任过去的行为,并对未来做出正确的决策。相关成果发表于最新一期的《自然·通讯》上。

  那么,目前我们让AI产生的记忆和人类的记忆是一回事吗?人工智能可以用什么方法产生记忆?与以往相比,此次“深层思维”提出的新方法有何不同?在赋予人工智能记忆方面,我们尚需做哪些努力?

  四种方法让AI产生“记忆”

  记忆是我们对过去的经历进行编码、存储、回忆等的能力。一般而言,可以将其视为利用过去的经验来影响当前行为的能力。它使人类能够学习以前的经验并与现在的实践建立联系。

  生活中那些感动我们的人或事往往会触发回忆,也就是我们通常所说的触景生情。“人类的长期记忆实际上是呈现多模态、场景化特征的,即一个记忆事件在存储时包含多个维度,触发某个维度就可以快速找到线索并进行回忆。”远望智库人工智能事业部部长、图灵机器人首席战略官谭茗洲在接受科技日报记者采访时表示,但人们往往高估了记忆量,其实我们的记忆容量很有限,所以人类记忆本身是高度抽象的,在记忆时我们通常选择对事件进行特征提炼,其中有好多要素只是概况并且是模糊的。如回忆电影,我们不会精准地回忆一帧一帧的完整成像,但如果类似场景再现,我们就会回想起之前的一幕。

  在以往的研究中,采用什么方法可以让AI产生回忆?

  谭茗洲介绍说,比较常用的有四种方法:第一种是长短期记忆网络。它是由一个被嵌入到网络中的显性记忆单元组成,功能是记住较长周期的信息。这一技术主要被谷歌、亚马逊和微软等公司用于语言识别、智能助手等。第二种方式是弹性权重巩固算法。这种算法主要用于序列学习多种游戏。“深层思维”采用的就是这种与记忆巩固有关的算法,目的是让机器学习、记住并能够提取信息。第三种方法是可微分神经计算机,这种计算机的特点是将神经网络与记忆系统联系起来,并像传统计算机一样存储信息,还可从例子中进行学习。第四种方法是连续神经网络,主要用于迷宫学习,解决复杂的连续性任务,同时可以迁移知识。

  解决长期信用分配问题是关键

  那目前,AI产生的记忆与人类的记忆是一回事吗?谭茗洲答道:“目前AI的记忆仍只是停留在将学习所获得的信息进行编码、存储,进而转化为认知的过程。以前的做法只是让AI将所发生的一切悉数存储,然而记忆与存储是有区别的,记忆是为了能够有效回忆。人类回忆的方式,往往是跨各种阈界的,如通过某个品牌忽然想起某个事。因此,要让AI智能体对过去所发生的一些事情,判断该不该记忆,关键要采取一些方法令其做出评定,达到人类回忆的效果。”

  要让AI能够实现回忆过去的事情,涉及到长期信用分配问题:即如何评估行为在长期行为序列中的效用。但人工智能现有的信度分配方法无法解决行为与结果之间存在长时间延迟的任务。

  据介绍,人工智能的研究中,在一个长序列内评估个人行为的效用问题,被称为信用分配问题。该评估可以对过去的行动或计划的未来行动进行评分。

  谭茗洲解释道:“具体在强化学习中,智能体获得指导的唯一途径是通过奖励,而奖励通常是稀疏和延迟的。当智能体得到奖励时,很难知道哪些行为应该被信任,哪些该被责备,这就是信用分配问题。”

  此外,谭茗洲介绍道,想让AI像人类那样产生回忆,首先需要让AI学会情景记忆以及自传式记忆。AI之所以很难做到这点,是因为情景记忆和自传式记忆有着非常强的个体体验特性。情景记忆与自传式记忆一旦和当事人割裂开来,就失去了生命力,对于机器而言,这很难想像。毕竟对于机器而言,精神可以独立于物质存在,体验可以独立于主体存在。此外还要防止机器可能出现的灾难性遗忘。认知心理学研究表明,人类自然认知系统的遗忘并不需要完全抹除先前的信息。但是对于机器而言,遗忘就是灾难性的,即需要抹除先前的信息。

  与人类复杂记忆相比仍是初级阶段

  据谭茗洲介绍,此次“深层思维”提出将范例建立在深入的强化学习基础上,并引入长期信用分配的原则。首先,智能体需编码并存储感知和事件记忆;然后,智能体需通过识别和访问过去事件的记忆来预测未来的回报;再有,智能体需根据其对未来奖励的贡献来重新评估这些过去的事件。这样可让智能体使用特定的记忆来信任过去的行为,并对未来做出正确的决策。

  为了做到这一点,“深层思维”论文显示,其做的首要工作是形式化任务结构,主要包括两种类型的任务。具体而言,在第一种信息获取任务中:一阶段,智能体需在无即时奖励情况下探索一个环境来获取信息;二阶段,智能体在很长一段时间内从事一项不相关的干扰任务,并获得许多附带奖励;三阶段,智能体需利用一阶段中得到的信息获取远端奖励。

  在第二种因果任务中:一阶段,智能体需采取行动触发仅具有长期因果关系的某事件;二阶段,同样是一个干扰任务;三阶段,为了取得成功,智能体需利用一阶段活动引起的环境变化来获得成功。

  而在研究这种结构的完整任务之前,研究人员考虑让智能体实现一个更简单的被动过程的任务——“被动视觉匹配”,即智能体不用采取任何主动措施去采集信息,如同一个人在街上走路,不经意间就观察到某些信息一样。

  “深层思维”的论文呈现一个打游戏过程中的简单场景,并让AI智能体对探索过的路径及攻略进行记忆,当然与人类复杂的记忆机制相比,还是相当初期的阶段。

  谭茗洲强调,正如论文所述,新方法的范式拓宽了AI研究的范畴。这是一个有趣的话题,涉及人脑科学的研究,以及神经科学、心理学和行为经济学等多学科交叉研究的尝试,今后还有很长的路要走,需要更多开放性的探索。

  延伸阅读

  目前人工智能系统还不具备长期记忆

  人脑从功能的角度可分为几个模块:寄存器、短期记忆、长期记忆、中央控制模块。人脑通过五种传感器,视觉、触觉等,从外部接受信息,存在寄存器,如果我们的注意力关注这些信息,大脑可以把这些信息变成短期记忆里的内容,短期记忆可以持续30秒左右,如果我们有意识要记住这些内容的话,大脑又会将短期记忆的内容转到长期记忆中。

  长期记忆的内容既有信息,也有知识。简单地说,信息表示的是世界的事实,知识表示的是人们对世界的理解,两者之间并不一定有明确的界线。人在长期记忆里存储信息和知识时,新的内容和已有的内容联系到一起,规模不断增大,这就是长期记忆的特点。长期记忆实际上存在于大脑皮层,在大脑皮层,记忆意味着改变脑细胞之间的链接,构建新的链路,形成新的网络模式。

  我们可以认为,现在的人工智能系统是没有长期记忆的。无论是阿尔法狗,还是自动驾驶汽车,都是重复使用已经学习好的模型或者已经被人工定义好的模型,不具备不断获取信息和知识,并把新的信息与知识加入到系统中的机制。

  有学者认为,具有长期记忆将使人工智能系统演进到一个更高的阶段。畅想5—10年后,有可能构建这样的智能系统,在这个系统中,有语言处理模块,包括短期记忆、长期记忆,系统能自己不断去读取数据,能把数据里面的知识做压缩后放到长期记忆模块。构建拥有长期记忆的智能问答系统,正是我们现在的愿景。

  本报记者 华 凌
【编辑:田博群】 ,AI巴洛克建筑风格 能忆起昨天的你了 但触景生情还有点难

相关:

浙江松阳县发生矿山山体塌方 致3人失联12月17日上午10时43分许,浙江省松阳县新兴镇安露源机制砂有限公司矿山突发山体塌方,初步排查现场施工人员17人,3人失联,其他均安全撤离。公司厂房(约2000余平方米)被埋。目前,正在全力搜寻施救中,塌方原因初步判断系天气持续异常干燥,造成山体松动。(央视记者 高珧)

中新网就刊发“野生红狐现身大兴安岭”不实新闻致歉【致歉】12月15日,本网发出《野生红狐现身黑龙江大兴安岭》一稿,因核实工作不够严格细致,导致报道的新闻不实,给广大网友造成困惑,在此诚挚道歉。

丁世均被提名韩国新任总理,破了一个记录韩国前国会议长丁世均(YTN新闻)海外网12月17日电 据韩联社报道,韩国总统文在寅17日提名丁世均为新任总理。丁世均现年69岁,是韩国前国会议长,经国会批准后,可正式就任总理。丁世均将成为文在寅政府时期第二任总理,也是韩国宪政史上首位前国会议长出身的总理。当天下午,文在寅亲自前往青瓦台春秋馆,向记者公布了提名消息。韩媒称,这体现了他对丁世均前国会议长身份的礼遇。资料图:文在寅与丁世均(《亚洲经济》)另一..

正面刚!《被光抓走的人》王珞丹黄璐“互撕” 电影《被光抓走的人》已于12月13日登陆全国各大影院,这部由金牌编剧董润年导演并编剧,黄渤、王珞丹、谭卓、白客、黄璐、宋春丽、文淇领衔主演,丁溪鹤、李嘉琪、吕星辰主演,焦俊艳、李倩、李诞、王菊友情出演,黄觉、丁冠中特别出演的现实主义爱情话题大片。王珞丹饰演李楠自上映以来,大家对电影中抛出的“我们什么时候变得不相爱了”和“爱情到底是什么”都进行了热烈的讨论,对电影中的情节也各持己见,堪称分级化讨论。..

这部国产片二刷还是如此火爆《南方车站的聚会》,后劲足不足?截止目前,这部电影票房已经超过1.96亿了,对于一部国产文艺片来说,这样的成绩实在很厉害。《南方车站的聚会》,值不值得二刷?答案也是肯定的。影片拥有极为细致考究的视听语言,镜头语言承担了叙事的功能,每一个镜头都可以反复品味。而这个高度寓言化的故事、犹如困兽之斗的主角们,角色关系、人物状态和演员表现,同样也值得玩味。就在上周末, 桃桃观影团也和资生堂旗下护肤品牌怡丽丝尔..

2019年,“新人导演”闪闪发光  2019年,“新人导演”闪闪发光  从《哪吒之魔童降世》的饺子、《铤而走险》的甘剑宇、《受益人》的申奥、《过春天》的白雪,到《罗小黑战记》的木头、《被光抓走的人》的董润年、《误杀》的柯汶利等等,今年有十多位新人导演带着首部长片亮相大银幕,口碑与票房均很漂亮,成为今年电影市场一道靓丽的风景线。记者发现,他们有的来自“坏猴子72变电影计划”、“HB+U”新导演助力计划、“青葱计划”、“FIRST电影展”等诸多..

偏见与人类大脑结构有关  偏见与人类大脑结构有关  科技日报北京12月16日电 (记者张梦然)偏见是如何产生的?据英国《自然·神经科学》16日发表的一项脑科学研究发现,内侧前额叶皮质后部(pMFC)会促进人类产生确认偏误。具体而言,对于那些不会让自己更加相信已有观念的意见,内侧前额叶皮质后部就不那么敏感。  人类倾向于忽视那些会破坏过去的选择与判断的信息。从政治到科学和教育,这种确认偏误都具有重要影响,但是这种信念形成特征背后的机..

三极地区升温速率为全球平均水平2—3倍  三极地区升温速率为全球平均水平2—3倍  科技日报讯 (记者刘垠)近日,由科技部主办的“三极环境与气候变化”主题边会在马德里气候变化大会(COP25)“中国角”成功举办。与会专家透露,通过研究发现南极、北极和第三极青藏高原是地球系统中最为敏感和脆弱的区域,三极地区升温速率是全球平均升温水平的2—3倍,异常升温也将导致极其严重的环境后果,严重改变三极乃至全球的生态环境。  科技部社会发展科技司司长吴远彬指..

为救9岁病危女儿 46岁妈妈捐肝  为救9岁病危女儿,46岁妈妈捐肝  “亲爱的妈妈,我要谢谢你,梦里陪伴我找寻,甜美的香气。亲爱的爸爸,我要谢谢你,灌溉我每一天,满满的勇气。亲爱的白衣叔叔阿姨,我要谢谢你,你们细致的关怀,热忱的心灵,使我重拾新生的勇气。”在江苏省人民医院的会议室里,来自泗阳的肝移植小患者,年仅9岁的小雨(化名)朗诵了自己写的这首小诗。小雨就要出院了,从一个月前的肝昏迷到现在的活蹦乱跳,离不开妈妈给了她403克的肝脏..

民警被嫌犯家属举报敲诈?警方:纪检部门仍在查  大庆警方再回应“民警被嫌犯家属举报敲诈”:纪检部门仍在查   黑龙江大庆市公安局萨尔图分局(以下简称“萨尔图分局”)民警张洪涛被犯罪嫌疑人于国江的家属举报涉嫌违纪违法一事仍无结论。   而于国江起诉张洪涛要求归还借款一事,萨尔图法院已判决张洪涛立即偿还剩余的10万元,但于国江家属称,张洪涛没有上诉,也没有偿还。 法院判张洪涛归还10万元。受访者供图   12月16日,大庆市公安局工作人员回应澎湃新闻..