北京海淀发布导航大模型 机器人能在复杂环境中自主导航
北京海淀发布导航大模型 机器人能在复杂环境中自主导航
北京海淀发布导航大模型 机器人能在复杂环境中自主导航6月(yuè)1日,北京海淀科技企业银河通用(tōngyòng)推出自主研发导航大模型TrackVLA,标志着机器人在复杂动态环境中的(de)自主导航跟随能力迈入了新的阶段。
北京青年报记者了解到,这款具备纯视觉环境感知、语言指令驱动(qūdòng)、可自主推理及(jí)零样本泛化(fànhuà)能力的具身大模型,让机器人从科幻电影中的想象逐渐走进现实生活。
TrackVLA的核心在于其“端(duān)到端”的设计理念,即模型能够直接从“看到的图像”和“听到的指令”中推理出“怎么走”,无需人为拆分多个(duōgè)步骤。这一特性使得TrackVLA在处理复杂导航任务时表现出色,无需提前构建环境地图,即可在不同环境中实现自主导航。即便是面对未见过的商场(shāngchǎng)、电梯(diàntī)、游乐区等场景,TrackVLA也能依靠内嵌的环境理解知识实现“现学(xiànxué)现走(xiànzǒu)”。
在具体(jùtǐ)功能上,TrackVLA展现了(le)八大核心能力。它能够(nénggòu)准确理解自然语言指令,实现目标的(de)识别与跟踪;在人流密集的环境(huánjìng)中,也能准确识别并长时自主跟随目标;若目标走出视野,它能通过空间智能和(hé)大模型推理(tuīlǐ)能力重新找回目标;同时,TrackVLA还能在不依赖额外采集训练数据的情况下,直接部署在陌生环境中实现长时稳定自主跟随。此外,它还具备灵活避障、适应复杂场景等特点。通过App,用户还可以实现远程可视守护,实时掌握家人动态。
值得一提的是,TrackVLA不仅稳定跟随人类,还能泛化至(zhì)任意移动目标,如机器狗跟随路上偶遇(ǒuyù)的动物狗狗,这一能力是训练(xùnliàn)时并未教授的,展现了其强大的泛化能力。
银河通用相关负责人表示,TrackVLA的推出不仅是前沿技术(qiányánjìshù)的突破,更是推进“通用具身智能机器人(jīqìrén)”落地过程中的重要一步。未来,TrackVLA将赋能(fùnéng)不同形态的机器人本体,打造更加多样化的产业生态和社会(shèhuì)服务。
文/北京青年报(běijīngqīngniánbào)记者 王斌

6月(yuè)1日,北京海淀科技企业银河通用(tōngyòng)推出自主研发导航大模型TrackVLA,标志着机器人在复杂动态环境中的(de)自主导航跟随能力迈入了新的阶段。

北京青年报记者了解到,这款具备纯视觉环境感知、语言指令驱动(qūdòng)、可自主推理及(jí)零样本泛化(fànhuà)能力的具身大模型,让机器人从科幻电影中的想象逐渐走进现实生活。
TrackVLA的核心在于其“端(duān)到端”的设计理念,即模型能够直接从“看到的图像”和“听到的指令”中推理出“怎么走”,无需人为拆分多个(duōgè)步骤。这一特性使得TrackVLA在处理复杂导航任务时表现出色,无需提前构建环境地图,即可在不同环境中实现自主导航。即便是面对未见过的商场(shāngchǎng)、电梯(diàntī)、游乐区等场景,TrackVLA也能依靠内嵌的环境理解知识实现“现学(xiànxué)现走(xiànzǒu)”。
在具体(jùtǐ)功能上,TrackVLA展现了(le)八大核心能力。它能够(nénggòu)准确理解自然语言指令,实现目标的(de)识别与跟踪;在人流密集的环境(huánjìng)中,也能准确识别并长时自主跟随目标;若目标走出视野,它能通过空间智能和(hé)大模型推理(tuīlǐ)能力重新找回目标;同时,TrackVLA还能在不依赖额外采集训练数据的情况下,直接部署在陌生环境中实现长时稳定自主跟随。此外,它还具备灵活避障、适应复杂场景等特点。通过App,用户还可以实现远程可视守护,实时掌握家人动态。
值得一提的是,TrackVLA不仅稳定跟随人类,还能泛化至(zhì)任意移动目标,如机器狗跟随路上偶遇(ǒuyù)的动物狗狗,这一能力是训练(xùnliàn)时并未教授的,展现了其强大的泛化能力。
银河通用相关负责人表示,TrackVLA的推出不仅是前沿技术(qiányánjìshù)的突破,更是推进“通用具身智能机器人(jīqìrén)”落地过程中的重要一步。未来,TrackVLA将赋能(fùnéng)不同形态的机器人本体,打造更加多样化的产业生态和社会(shèhuì)服务。
文/北京青年报(běijīngqīngniánbào)记者 王斌

相关推荐
评论列表
暂无评论,快抢沙发吧~
你 发表评论:
欢迎