当前位置: 科技先知道 » 人工智能 » DeepMind突破机器人学习瓶颈:自主进化式训练开启智能新纪元

DeepMind突破机器人学习瓶颈:自主进化式训练开启智能新纪元

谷歌DeepMind最新研究彻底改变了机器人传统学习模式。传统的行为克隆方法需要海量标注数据,成本高昂且难以适应新场景。这项突破性研究借鉴大语言模型的微调经验,创新性地提出两阶段训练法。

第一阶段通过监督微调,让机器人掌握基础操作技能。第二阶段引入自我提升机制,使机器人能够像人类一样通过反复练习自主进化。实验采用30亿参数的PaLI视觉-语言模型,在LanguageTable和Aloha两种机器人平台上验证了方法的有效性。

数据显示,在LanguageTable任务中,仅增加10%的自主训练时间,成功率就从45%跃升至75%。相比之下,单纯扩大8倍模仿数据量仅将成功率提升至60%。这种新方法展现出惊人的样本效率。

更令人振奋的是,该系统实现了真正的行为泛化。在名为“BananaTable”的新任务测试中,机器人成功掌握了推击香蕉的精准技巧——这种细长物体的操控需要完全不同于训练数据的新技能。

研究团队指出,该方法仍存在优化空间,包括需要更好的训练停止机制和自适应正则化器。但随着多模态数据集的完善,这种自主进化式学习有望彻底改变机器人的技能获取方式,为通用机器人发展开辟全新路径。

未经允许不得转载:科技先知道 » DeepMind突破机器人学习瓶颈:自主进化式训练开启智能新纪元

相关文章

My title