首页 -> 新闻 > 科技 > 正文

AI向真正“智能学习体”迈进 相关研究成果发表在《自然》

    来源: 科技日报  2021-02-25 14:50:17

英国《自然》杂志24日发表一项人工智能研究成果:美国团队报告了一类增强学,可回溯过去、解决复杂任务,真正改善了对复杂环境的探索方式,有望应用于机器人、语言理解和药物设计领域。这类算法被统称为“Go-Explore”,其已经在一款经典游戏的算法挑战中得分超过了人类玩家和先进的人工智能系统。该成果被认为正朝着实现真正“智能学体”迈出了重要一步。

增强学,可让人工智能系统通过探索和理解复杂环境来进行决策,并学如何以最优的方式获得奖励。奖励可以包括机器人抵达特定位置或是在电脑游戏中达到一定的等级。然而,当遇到很少给予反馈的复杂环境时,现阶段的加强学算法就很容易碰壁,这让人工智能专家们非常苦恼。

美国“OpenAI”是由诸多硅谷巨头联合建立的人工智能非营利组织,推动者包括美国创业孵化器Y Combinator总裁萨姆·阿尔特曼、美国太空技术探索公司(SpaceX)创始人埃隆·马斯克等,其目标是希望能够预防人工智能的灾难影响,并推动人工智能发挥积极作用。此次,“OpenAI”的科学家艾德兰·艾克菲特、朱斯特·赫伊津哈及团队,提出了有效探索面临的两个主要障碍,并设计了一类算法来解决这些障碍。

研究人员表示,“Go-Explore”可以对环境进行全面探索,同时构建一个档案库来记住它去过的地方,确保自己不会忘记通往有望成功的期中阶段或是最终胜利(奖励)的路线。其在雅达利经典游戏中的得分,超过了人类玩家和先进的人工智能系统,研究人员用这类算法,解决了之前未能解决的2600个雅达利游戏,验证了这类算法的潜力。“Go-Explore”在算法挑战《蒙特祖马的复仇》中的得分是之前的4倍,在另一个算法挑战《玛雅人的冒险》中的得分也超过了人类玩家的均水。而相对的,此前的算法一分都拿不到。

“Go-Explore”算法还能完成一个模拟机器人任务,在这项任务中,它必须用机械臂把东西捡起来并放到4个架子中的一个架子上,其中两个架子被关在两扇门的后面。

研究人员指出,记住并回到有望成功的探索区域的简单原则是一种强大、通用的探索方法。他们认为最新的算法有望应用于机器人、语言理解和药物设计。

【免责声明】

1、凡本网注明出处非(巨潮财经网)的作品,均转载于自其它媒体,并不代表本网赞同其观点和对其真实性负责,目的在于信息的传递,本网不承担稿件侵权行为的连带责任,如对稿件有质疑请与本网客服联系。

2、刊发此文目的在于传递更多信息,文章内容仅供参考,不构成投资建议,投资者据此操作,风险自担。

3、如涉及作品内容、版权等其它问题,请在15日内联系本网客服。

阅读延展

AI向真正“智能学习体”迈进 相关研究成果发表在《自然》

英国《自然》杂志24日发表一项人工智能研究成果:美国团队报告了一类增强学习,可回溯过去、解决复杂任务,真正改善了对复杂...

2021-02-25 14:50:17

“超海森堡极限”与海森堡极限的量子精密测量可同时实现 研究成果发表在《物理评论快报》上

2月22日,记者从中国科学技术大学获悉,该校郭光灿院士团队李传锋、项国勇研究组与香港中文大学袁海东教授合作,在量子精密测...

2021-02-25 14:45:49

科学家揭示水稻叶形调控新机制 相关研究论文发表于《植物生理(Plant Physiology)》杂志

叶片在植物的光合作用、蒸腾作用等过程中扮演着重要角色,那么叶子的卷曲度会影响其作用的发挥吗?记者2月上旬从中国农业科学...

2021-02-25 14:44:11

钠离子电池或成我国能源超车新赛道 新能源新星正在产业化路上加速

日前,中国科学院物理研究所孵化的高新技术企业中科海钠科技有限责任公司(以下简称中科海钠)、华阳新材料科技集团有限公司与...

2021-02-24 14:40:02

传统电厂华丽转身,用智慧点亮万家灯火 实现人机结合远程“问诊”

他正在辅助人工,进行7、8号炉380伏除灰段配电室的无人值守智能巡检监测。这个认真工作的员工就是国家能源集团江苏太仓电厂(...

2021-02-24 14:37:22