3月29日,在2025中关村论坛年会通用人工智能论坛上,北京通用人工智能研究院发布研究成果,全球首个通用智能人“通通”2.0升级迭代正式亮相。相较于“通通”1.0版本,“通通”2.0在语言、认知、动作、学习、情绪、交互方面实现了多种核心能力的升级。
北京通用人工智能研究院院长,北京大学人工智能研究院、智能学院院长朱松纯认为,通用人工智能是指具有高效的学习和泛化能力、能够根据所处的复杂动态环境自主产生并完成任务的通用人工智能体,具备自主的感知、认知、决策、学习、执行和社会协作等能力,且符合人类情感、伦理与道德观念。
“通通”生活在高度仿真的复杂、动态三维虚拟场景中。据介绍,经过升级迭代,“通通”2.0在价值与心智驱动的多轮对话、基于交互反馈的推理和学习、多智能体交互上取得进步。
其中,在价值与心智驱动的多轮对话方面,“通通”2.0版本在理解对话目标意图的基础上,遵循自身价值和人格,利用对话策略来引导对话的走向,从而达到自身的目的。在价值调控对话生成、消除模型幻觉、保持对话前后连贯性以及“言行一致”等方面取得突破。比如,当“妈妈”要求“通通”睡觉,或者吃不喜欢的食物时,“通通”可以向“妈妈”耍赖,找理由磨蹭,并试图要求“妈妈”给予奖励,在多轮协商达成一致后才会实施对应任务。
在基于交互反馈的推理和学习方面,1.0版本的“通通”在任务执行过程中,如果周围环境时刻在发生变化,会导致其原本规划的任务无法顺利完成。但“通通”2.0可以实时响应外界场景的变化,进行反思和重新规划,对已有任务进行挂起、恢复、修改或取消等处理,同时动态生成新的任务规划,从而以更灵活、智能、多变的方式完成指令。
例如,当2.0版本的“通通”想打开空调时,研究人员利用VR手柄多次改变遥控器位置,让其无法轻易拿到,“通通”进行了一系列尝试:先是脱鞋上沙发,然后再利用沙发上的靠垫,增加自身高度后最终拿到放在墙架上的遥控器;在按下遥控器,空调仍未打开时,研究人员可以教导其“电器需要插上插头才能使用”,“通通”在遵循教导成功打开空调的同时能够更新自己的技能库,使得该项技能、知识被长期存储。
据介绍,随着“通通”的持续迭代,其能力也在稳步提升,目前研究人员正利用认知心理学定义的5至6岁儿童应掌握的经典任务对“通通”进行测试,“通通”已经通过了多项综合性强、复杂度高的任务考核。
当天,北京通用人工智能研究院还联合乐聚、宇树等多家人形机器人公司共同发起成立“通智大脑联盟”。该联盟通过打破技术壁垒,聚焦垂域场景的通智大脑和具身本体协同研发及应用,将实现在物理空间上具身智能体从感知到决策、从学习到执行的闭环,加速核心技术突破与成果转化。
朱松纯表示,未来“通通”将成为通用底座支撑各类垂直应用场景,进一步学习行业特定的知识和技能,形成千万个“通用智能人”赋能千行百业交易股票的平台,同时与具身智能机器人相结合,为智能制造、智慧城市、养老陪护、数字助理、家用机器人等领域带来革命性的变化。