通往具身通用智能:如何让机器从自然模态中学习到世界模型?

研究领域:通用具身智能,强化学习,世界模型,层级化抽象,涌现
1 主流的具身智能
训练方法面临的挑战
主流的具身智能
2 近期突破:语言任务预训练带来
组合/系统性泛化能力
近期突破:语言任务预训练带来
3 目前的具身智能系统
距离通用具身智能的根本性差异
目前的具身智能系统
一种是通过构建一个与真实环境类似的模拟器,在模拟器中使用大量数据学习到一个策略,然后在真实环境中零样本泛化或在线微调 (如[5, 6]); 另一种方案是学习一个关于环境的模型,并利用学到的模型来生成学习数据 (如[7, 8, 9]),从而极大得减少对真实环境数据的需求,基于这一想法,Philipp Wu et.al. [9] 展示了仅仅通过与真实物理世界进行1小时的交互就能让机械狗学会走路并抵抗外界的干扰。
任务指定问题、常识、

5 在机器/统计学习框架下
如何学习世界模型
在机器/统计学习框架下
(1)神经网络架构
(2)学习法则
(3)目标函数
(4)数据/环境
6 总结
作者在此感谢岳玉涛博士,徐博文,冯睿洋对本文提出的修改意见。
学者简介

沈马成,从麻省理工学院机械系取得博士学位,师从美国工程院院士Jonathan How,博士期间主攻的研究方向为多智能体强化学习和机器人,在计算机视觉,机器人感知,自动驾驶等方面有较为丰富的研究经历。在包括Meta Reality Lab,Dexterity等多家人工智能实验室和公司从事过相关的研发工作。目前的研究方向包括通用具身智能,对探索智能现象背后的普适性原理以及未来的强人工智能可能导致的生存性风险很感兴趣。
参考文献
更多内容,点击下方关注:
