当前位置：首页-> 滚动 ->内容

新方法帮助机器人导航使用语言基输入而不是昂贵的视觉数据

2024-06-18 11:09| 来源：盖世汽车|阅读量：5614|

盖世汽车讯有一天，人们可能希望自己的家用机器人把一大堆脏衣服搬到楼下，并把它们放进地下室最左边角落的洗衣机。机器人需要将指令与它的视觉观察结合起来，以确定它应该采取什么步骤来完成这项任务。

对于人工智能本体来说，这说起来容易做起来难。当前方法通常使用多个人工创建的机器学习模型来处理各部分任务，基于大量的人力和专业知识而构建。这些方法通过视觉表征(visual representation)来直接做出导航决策，需要大量的视觉数据来进行训练，而这些数据通常很难获得。

据外媒报道，为了克服这些挑战，麻省理工学院和MIT-IBM Watson AI实验室的研究人员设计了一种导航方法，将视觉表征转换为语言片段，然后将其输入大语言模型中，该模型可以实现多步导航任务中的所有部分。

声明：免责声明：此文内容为本网站转载企业宣传资讯，仅代表作者个人观点，与本网无关。仅供读者参考，并请自行核实相关内容。

热门阅读

精彩阅读

华为深度赋能AITO问界带来前

近几年，伴随着新能源汽车快速发展，新能源品牌也在不断涌现。据统计，2022年国内...

精彩资讯

推荐资讯

车主网 | 网站地图 | RSS订阅

车主网-未经本站允许，禁止镜像及复制本站。投诉及建议联系邮箱：linghunposhui@sina.com
Copyright © 2018 All Rights Reserved 车主网 car.lmzcn.com 版权所有,备案号：沪ICP备2022017705号