“地表最强”人形机器人亮相:视觉语音推理能力 每天打工20+小时
2024-09-29 07:11:15智能装配

  当地时间周二早晨,获得微软、英伟达、OpenAI投资的人形机器人明星企业Figure如期发布最新款人形机器人Figure 02。基于机载算力和各个组件的全方位升级,AI人形机器人朝着“进厂打工”又迈进了一大步。

  顺便一提,随着人工智能大模型的飞跃式发展,这款被不少媒体称为“地表最强人形机器人”的AI设备,也已经具备视觉推理和聊天沟通的能力——操作机器人的默认UI就是语音控制。

  与2023年发布的第一代产品相比,Figure 02最明显的不同之处在于外观的彻底重构——机器人完全采用外骨骼结构(由外皮承担负载和压力),机器人的电源和算力布线集成在机体内部,来提升了机器人的可靠性,也使得封装更加紧实。

  Figure的创始人兼首席执行官布雷特·爱德考克(Brett Adcock)透露,为了这个设计,公司还重新定制了电线端子和连接器。

  当然,人形机器人最关键的升级点,依然是如何从一堆电线、芯片和算法,拼出一个活灵活现的“打工(机器)人”。

  公司披露,Figure 02身上总共装了6个RGB摄像头,分别位于头部、胸前和后背,因此这个机器人也拥有着“超人”视觉。

  配合输入的图像资料,机器人可以通过AI驱动的视觉系统感知和理解真实的物理世界。Figure 02配备了机载的视觉语言模型(VLM),使其可以有效的进行快速的常识性视觉推理。

  爱德考克表示,相较于上一代产品,Figure 02的机载计算和AI推理能力翻了3倍,使得许多真实世界的AI任务能够完全自主执行。公司的AI数据引擎将不断提供最新的模型,供机器人在本地GPU上运行。

  除了视觉以外,Figure 02也搭载了公司投资人OpenAI专门定制的语音到语音推理模型,通过机载麦克风和扬声器与人类进行对话。爱德考克也透露,这个机器人的默认UI是语音。

  Figure 02也搭载了公司投资人OpenAI专门定制的语音到语音推理模型

  虽然在谷歌和OpenAI的较劲升级后,AI实时语音聊天已不再是夺人眼球的新鲜功能,但对于人形机器人而言,应用这项技术仍有重大的意义。毕竟这个70公斤的大铁块,迟早有一天将会与人类在同一个屋檐下“打螺丝”,能够响应语音指令,将会是人类重要的安全工具。

  在投资者最为关心的连接器等方面,Figure并没有给出明确的信息。公司仅表示,Figure 02上搭载的第四代机械手具备16自由度,拥有与人类相当的力量,能完成许多近似人类的工作。同时整个机械手的机械、电器、控制和传感器设计,都是由企业内部完成的。

  最后,这台机器人还有一个不怎么起眼但很重要的升级,机器人内部的电池组容量提高了50%至2.25KWh。爱德考克解释称,这个设计旨在最大限度地延长机器人的运行时间,公司希望Figure 02可以在一定程度上完成每天实际有效的上班时间超过20小时。

  值得一提的是,公司官网的参数说明一栏中,显示Figure 02的续航时间只有5小时。合理推断爱德考克提供的应该是“充电+干活”的极限工作时间。

  稍有遗憾的是,Figure公司目前并没有广泛推出Figure 02的时间表,仅暗示各位吃瓜群众不要把想象力局限在“机器人进厂打螺丝”上。公司表示,Figure 02将人类形态的灵巧性与先进的人工智能相结合,可以在商业应用中执行各种任务,并且在不久的将来,还可以在家中执行各种任务。

  作为发布前的试验,宝马汽车的装配厂已经接纳过一批Figure 02“实习工人”。除了主动执行汽车装配的程序外,AI也能自动识别和纠正已习得行为习惯的错误。

  宝马集团也在周二发表公开声明称,Figure 02在美国斯帕坦堡工厂试运行期间,从事的是将钣金部件插入特定装置的工作,机器人必须特别灵巧才能完成这个工作。宝马集团表示,使用机器人能避免员工从事不符合人体工程学的笨拙、累人任务。集团正在与Figure一起测试和评估,如何在汽车生产中安全地使用人形机器人。

  宝马汽车的装配厂已经接纳过一批Figure 02“实习工人” 来源:宝马官网

  宝马集团生产管理委员会成员Milan Nedeljković表示,通过早期的测试,双方现在正在确定人形机器人在生产中的可能应用。

Copyright © 2018 乐鱼官网app平台游戏下载 All Rights Reserved
网站地图 备案信息: 湘ICP备14017517