5620亿参数!谷歌发布史上最大“通才”AI模型PaLM-E,可让机器人
,周一,来自谷歌和柏林工业大学的一组人工智能研究人员推出了史上最大的视觉语言模型 ——PaLM-E,参数量高达 5620 亿。
PaLM-E 是迄今为止已知的最大 VLM。作为一种多模态具身 VLM,它不仅可以理解图像,还能理解、生成语言,执行各种复杂的机器人指令而无需重新训练。它还展示出了强大的涌现能力(模型有不可预测的表现)。
据谷歌称,当得到一个高级命令,如“把抽屉里的米片拿给我”,PaLM-E 可以为带有手臂的移动机器人平台生成一个行动计划,并自行执行这些行动。
PaLM-E 通过分析来自机器人摄像头的数据来实现这一目标,而无需对场景进行预处理。这消除了人类对数据进行预处理或注释的需要,使机器人控制更加自主。
PaLM-E 还很有弹性,能够对环境做出反应。例如,PaLM-E 模型可以引导机器人从厨房里拿一袋薯片,由于 PaLM-E 集成到了控制回路中,它对任务中可能发生的中断有了抵抗力。在一个视频例子中,一名研究人员从机器人手中抓起薯片并移动它们,但机器人找到了薯片并再次抓起它们。
另外,PaLM-E 模型也可控制机器人自主完成原需人类指导的复杂任务。除了机器人技术外,谷歌研究人员还观察到使用大型语言模型作为 PaLM-E 核心的几个有趣效果,其中一个是 PaLM-E 能表现出“正向转移”,这意味其可将从一个任务中学到的知识和技能转移到另一个任务中,相较单任务机器人模型能有更好的表现。
谷歌研究人员计划未来将探索 PaLM-E 在现实世界中有更多应用,例如家庭自动化或工业机器人,也希望 PaLM-E 能够激发更多关于多模态 AI 的应用。
IT之家曾报道,身为谷歌 AI 劲敌的微软近期也发表了「ChatGPT for Robotics」的论文,以类似的方式结合视觉数据和大型语言模型来控制机器人。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
热门阅读
- 1滑雪装备有多少kg滑雪装备多少
- 2福布斯中国发布2023中国商界20位
- 3中字头央企持续活跃多只基金年内涨超1
- 4爱美客2022年报点评:业绩增长符合
- 5武汉租车哪个平台比较好武汉租车公司为
- 6用玻璃水擦窗户干净吗用玻璃水擦窗户是
- 7智联招聘携手职场女性洞察“她世界”3
- 8可载24万吨货物!我国自主研制的最大
- 9中国联通00762发布年度业绩,股东
- 10广发银行金融赋能两个合作区建设
- 11现代起亚汽车奥罗拉战略投资自动驾驶技
- 12“美好共建计划”启动呼吁加强对HPV
- 134米2货车需要什么驾照什么驾照可以开
- 14渠道共赢起亚与道达尔签约战略合作协议
- 15线索转化率提升超30%!一汽红旗牵手
- 16汽车电瓶多久不开会没电汽车多久不开电
- 17《英雄联盟》手游4.1版本3月16日
- 18Ginetta为阿斯顿·马丁的秘密对
- 19四环医药子公司轩竹生物科创板IPO遭
- 20中核集团:全球首项核聚变领域国际标准
- 21国产特斯拉ModelY中型SUV改用
- 22小米POCOF5手机通过FCC认证,
- 23ChatGPT大热,消息称苹果正“重
- 24中国联通同华为完成5G-Advanc
- 25ETC怎么拆怎么拆ETC
- 26路虎是哪个的品牌路虎是的吗
- 27安全带怎么解开安全带如何解开
- 28在2017年法兰克福车展期间SEAT
- 293月醒春发现精彩,小奇同学会灵感再出
- 30女子花费两万多在恩朗医美割双眼皮术后
汽车点评网 分析汽车
关注汽车点评网,收听和分享“汽车秘密”
携手汽车点评网,为您提供更多汽车行业新鲜货。