联系方式 010-53322951
行业研究
研究报告
动态监测
排行榜
专为机器人行业而设计,谷歌推出两款新型AI模型
来源:研精毕智调研报告网 时间:2025-03-14

市场调研发现,3月12日,谷歌宣布推出两款基于Gemini 2.0的新型人工智能(AI)模型,旨在开发更灵活、可互动的机器人,有望推动机器人在更多场景中的应用和普及。

谷歌表示,最新的AI模型是为各种形状的机器人设计的,包括人形机器人和工厂、仓库中使用的其他类型的机器人。

据谷歌介绍,其中一款名为Gemini Robotics,是一款视觉-语言-行动模型,能够通过物理动作输出结果,使机器人可以理解自然语言指令并执行复杂任务。更简单的说,Gemini Robotics可以听懂人类的语言,然后执行相应的命令。

另一款名为Gemini Robotics-ER,是一个专注于空间推理的视觉-语言模型,能够帮助机器人更好地理解周围环境,并支持开发者利用其推理能力运行自己的程序。

专为机器人行业而设计,谷歌推出两款新型AI模型

谷歌DeepMind工程师Kanishka Rao表示,谷歌将Gemini模型应用于机器人,正在推动机器人技术向更智能、更通用的方向发展。“我们的世界非常复杂、动态且丰富,我认为通用智能机器人需要能够应对这种复杂性。”

与此同时,包括Meta、特斯拉和OpenAI等巨头均加大了在机器人领域的研发工作,许多初创公司也在机器人领域崭露头角,例如,Figure AI和Skild AI等,它们的估值都达到了数十亿美元。

在预先录制的演示视频中,谷歌研究人员展示了运行其技术的机器人如何响应简单指令。其中一台机器人站在一堆字母拼图前,在训练员要求它拼出一个单词时,它拼出了“Ace”。

工程师们还在实验室里搭建了一个迷你玩具篮球场,另一台机器人在被要求完成扣篮动作时,将一个小塑料球按进了篮筐。

Rao声称:“当我们第一次看到机器人扣篮时,整个团队都非常兴奋。这是因为机器人从来没有见过任何与篮球有关的东西。它是通过Gemini理解了篮网的外观以及‘扣篮’这个词的含义,并能把它们联系起来,然后在现实世界中完成这项任务。”

不过,谷歌强调这项工作仍处于“早期探索”阶段。DeepMind研究员Vikas Sindhwani表示,Gemini模型是在对物理环境中的“常识性安全”有深刻理解的基础上开发的。

他还提到,谷歌计划逐步部署这些机器人,最初将它们放置在与人类保持安全距离的位置,随着时间推移,在安全性能不断提升的情况下,逐渐增加其互动性和协作性。

(XYZResearch),系国内领先的行业和企业研究服务供应商,并荣膺CCTV中视购物官方合作品牌。公司秉持助力企业实现商业决策高效化的核心宗旨,依托十年行业积累,深度整合企业研究、行业研究、数据定制、消费者调研、市场动态监测等多维度服务模块,同时组建由业内资深专家构成的专家库,打造一站式研究服务体系。研精毕智咨询凭借先进方法论、丰富的案例与数据,精准把脉市场趋势,为企业提供权威的市场洞察及战略导向。

010-53322951
专属分析师
08:00 - 24:00
热门报告 定制报告 深度报告 行业洞察 专家库
×
客服 客服
客服
定制需求
需求
提交
咨询 咨询
咨询
联系人
电话 电话
电话
010-53322951
18480655925 微同
微信 微信
微信
公众号 订阅号
服务号 服务号
顶部 顶部
顶部
×
提交您的服务需求
关闭
联系人资料
*公司名称
联系地址
企业邮箱
*手机号码
*联系人
职务
备注
个性化需求 个性化需求 项目详细需求 (可展开填写)
close
项目需求
本次需求产生背景:
被研究产品或服务:
被研究企业或细分行业:
您期望的研究国家或地区或城市:
本次研究涉及的内容:
本次调研重点关注的内容:
期望产生结果:
您期望的研究方法(有或者无,我们会根据项目难度决定):
预计启动时间:
预计完成时间:
预算情况:
Baidu
map