经纬创投：在人潮涌动的世界机器人大会上看到了AI科技的新起点_智能控制解决方案

经纬创投：在人潮涌动的世界机器人大会上看到了AI科技的新起点

2024-09-03 03:18:43智能控制解决方案

8月21日，2024年世界机器人大会在北京正式开幕，与以往最大的不同在于，

随着AI突飞猛进，具身智能成为了今年长期资金市场上最热的领域之一，那些曾经仅存在于科幻电影中的机器人，正离真实的生活慢慢的接近，变得“看得见、摸得着”。

在开幕前后，也有多家机器人公司发布了新产品，比如经纬创投投资的宇树科技发布了G1量产版本，起售价为9.9万元，这款产品在世界机器人大会上首次展出，更强性能、终极外观，最关键的是可以大批量生产了。

宇树G1机器人身手敏捷，不但可以空中劈腿，还能自由地上下楼梯，轻巧敏捷

智元机器人则是一口气发布了五款商用人形机器人产品，包括3款适用于不同场景的远征系列（A2、A2-W、A2-Max），2款模块化机器人系列新产品（灵犀X1和X1-W，后者面向专业数据采集）。

星尘智能则发布了新一代AI机器人助理Astribot S1，这款产品也在2024世界机器人大会上正式亮相。

今天随着人形机器人越来越走进现实，也迎来了群雄逐鹿的时刻，但技术路线仍不确定、应用场景皆有可能。经纬创投在几年前就系统性地关注通用智能机器人赛道，在机器人软硬件一体化领域，投资了宇树科技、智元机器人、银河通用、星尘智能，它们都是优秀的全技术栈型勇于探索商业模式的公司，但各自的技术切入方向并不相同，切入的应用场景也不完全一样，有工业、仓储物流、零售、生物制药等等场景。短期目标都是快速占领各自的应用场景，谁先把一个细分场景做好，积累出足够多的数据，就非常有可能继续拓展新的延展领域，最终走向通用化。

除了机器人软硬件一体化外，在产业链上游的两个重要方向（数据、一体化关节），经纬创投也投资了AI仿真数据领域的光轮智能，正在为行业提供海量的高真实性、高效用性的训练数据；而在一体化关节/执行器领域，经纬则投资了钛虎机器人，钛虎有非常高效和全面的产品系列，覆盖了从灵巧手到全身上下的所有关节……

相比于AI大模型，人形机器人更需要工程层面的实践与突破。比如1990 年出生的王兴兴，并不是履历亮眼的学霸型创业者，他是一个典型的理科偏才。“大家可能觉得很多顶尖院校的人很厉害，但实际上大家都是普通人，在机器人这个行业里，很多人只做软件，完全没碰过硬件，而硬件是实践出来的，你知道就是知道，不知道就是不知道。” 宇树科技创始人兼CEO王兴兴说，在大学时代他就发现，只要集合最好的零部件，并且用上最先进的软件，就能做出一个更好产品，组合式创新。

与王兴兴有着类似的经历，钛虎创始人易港是一位95后，早在大学宿舍就搞起了3D打印机和焊台，大一就做出了假肢原型机，还在中美创客大赛中获奖；大二又做出了一套主从式外骨骼，手部拥有17个自由度。他总结自己为什么能在大学时期的很多奖项中，打败名校的参赛项目，最核心的就是自己的产品“看得到、摸得着、能体验，对社会有直接价值，而不是漂亮的PPT。”

随着AI大模型的突破，今天的人形机器人，正越来越逼近临界点。有更多之前不敢想的任务，如今都能轻松实现了。特别是随着“世界模型”的提出，机器人的真机数据越来越具备实用价值。

“下一个十年，最值得做的就是人形机器人。”星尘智能创始人来杰说，他曾是腾讯RoboticsX机器人实验室的一号员工、百度“小度机器人”团队负责人，在去年底离职创业。

“人工智能的黎明已经迅速临近，我预计在明年年底之前，全球至少会有一个企业能够推出相对通用的机器人AI模型，发展速度之快令人瞩目。” 王兴兴说，“我在年初提出了这一观点，至今仍然坚信，明年年底实现这一目标是非常有可能的。”

今天的机器人与以往最大的不同之处在于，随着AI的爆发，智能泛化能力大幅加强，这让通用机器人成为可能。传统机器人并不是特别需要对外界自主响应，所以这是一个自动化设备，不断地重复之前预设的程序。而现在有了智能泛化能力的突破，甚至只需要语音控制，机器人就能实现新功能，这是从自动化到智能化的底层转变。

而AI大模型的能力，不仅体现在规划层面，也开始步入感知和控制环节，机器人发展了50多年，第一次出现这样由学习算法驱动、以及一个非常大的预训练模型来推动控制环节的变化，这也是过去一年里，我们正真看到技术层面最大的突破。

“最终我们会有大脑大模型、小脑大模型，一起把本体串起来，构成一个通用机器人系统。”北大-银河通用具身智能联合实验室主任王鹤说。他认为，通用机器人应该由基石层和能力层支撑，在基石层最关键的是去打造一个通用的本体，数据依赖于本体，本体也决定了它能产生什么样的数据，两者相互绑定。基于本体和数据，进而发展出机器人能力，主要是“大脑”和“小脑”，前者主要解决感知和决策问题，后者把大脑的感知和决策转换成动作。

比如智元机器人也遵循了这样的思考逻辑。“稚晖君”彭志辉从华为离职创业后，与上海交通大学博士生导师闫维新，组建了创始团队，其中闫维新负责人形机器人的“身体”，彭志辉负责人形机器人的“大脑”。“过去，他们在工作中有一些交集，创始人（彭志辉）提出这个想法之后，大家一拍即合。”

远征A1，是智元机器人的第一代产品，已于去年8月亮相。其步行速度为7公里/小时，依靠视觉传感器和多线激光雷达可自主避障。它的灵巧手有5根手指，能像人类一样抓取物品。应用场景专注于工厂、生物实验室、家庭护理与陪伴等。

而一年之后，8月18日上午，智元机器人一口气发布了“远征”与“灵犀”两大家族共计五款商用人形机器人新品：交互服务机器人远征A2、柔性智造机器人远征A2-W、重载特种机器人远征A2-Max、智元X-Lab孵化的首个全栈开源机器人灵犀X1、专业数采机器人灵犀X1-W。

智元在发布会现场，搭建了一个摄影棚，机器人当场秀了一次在语音指令下，动手调饮料的操作

对于机器人这样，离不开硬件做最终执行的赛道，“软硬一体”的能力尤其重要，像宇树科技、智元、银河通用、星尘等等公司都很看重这一思路。如果我们看电动车与无人驾驶行业的历史，2015年第一批电动车勇于探索商业模式的公司创立至今，在这样的一个过程中，无人驾驶勇于探索商业模式的公司的数量，并不少于电动车勇于探索商业模式的公司。但在今天，单纯做无人驾驶的勇于探索商业模式的公司大多数都处于挣扎状态，鲜有获得业务突破，哪怕曾经获得过巨额融资。

但从电动车企的角度，不仅“蔚小理”等一众新兴电动车企崛起，先有了“硬件”、产生数据闭环，再切入无人驾驶，反而有很大的业务进展，各家的城市NOA越来越智能。如果一个行业离不开硬件支撑，并且这个硬件仍处于快速迭代期，单纯做这行业的软件是要冒极大风险的。

类似于新能源汽车核心的三电系统，彭志辉将机器人的核心系统分为：动力域（电机关节、伺服控制、电源管理）、感知域（传感器模块、感知算法）、通信域（网络接口、数据传输协议、中间件框架）、控制域（通用算力、AI算力单元、运控算法、具身算法）。

“整个机器人其实是一个软硬件极其复杂的系统，既涉及到内部各个硬件模块的协同和部署，同时也需要软件跟算法高效配合。” 彭志辉说。

“我们在过去一年里，同时在G2落地和G3预研两个方向，都取得了一些阶段性突破。在G2阶段实现了一系列zero-shot和few-shot的一些通用原子能力，比如通用的位姿估计模型UniPose。目前也正在与多家制造业和服务业领军企业，进行联合的场景POC，今年晚些时候有望全流程跑通，让机器人能够正式在客户场景中部署干活。” 彭志辉说。

低成本是人形机器人大规模运用的前提。今年5月，宇树在发布G1人形机器人时，把最便宜售价打到了9.9万元。但这款机器人的参数一个不差，身高约127厘米，体重约35公斤，具有超越常人的灵活性，小跑速度大于2m/s，拥有广阔的关节运动空间，23至43个关节，最大关节扭矩达到120N.m，可进行高难度的动态动作。比行业整体便宜80%的售价，再一次成为人形机器人领域的焦点。

“大部分人对社会的成本结构一无所知。”王兴兴说，“低成本的原因其实很简单，以前很多学术或企业主要靠去买工业电机，但它们很大、很贵、很重，所以做出来的效果也不太好。但我后来发现，其实可以对航模电机加以改造，所以后来的电机驱动器全是我自己做的，能做到很小很便宜，再结合最新的运动控制技术，就可以把整体性能做得很好。其实整个社会大部分创新，是组合式创新，我们应该把各个行业的一些想法、技术组合做新的实践，保证它是最前沿的，其实你就能轻松实现很多目标。”

在2013年-2015年读研究生期间，王兴兴没什么资源和资金，却做出了一款当时特别火爆的产品XDog，拿到上海机器人设计大赛二等奖，这几乎是他一个人从头设计硬件、控制算法，自制驱动电机做出来的。相比之下波士顿动力的四足机器人，还是纯液压方案，虽然性能不错，但是很大、很贵、很重，那时候纯电机驱动方案是比较领先的。

“在制造成本方面，我甚至认为机器人其实与家里的电风扇本质是一样的，都能够最终靠各种方法将成本做到极致。”王兴兴说，他认为大部分产品都可以分为“材料成本+加工成本”，如果能优化整个流程，找到合适的加工方法，其实可以省很多钱。

与王兴兴读研期间做了XDog类似，钛虎创始人易港也在大学时期，东拼西凑了4-5万元，在大学宿舍里买了3D打印机和焊台，自学3D建模和编程，模仿德国骨科隐形冠军企业奥托博克的产品，制作出了一款假肢原型机，并在中美创客大赛中获奖。

“做机器人，充满了工程方面的问题，很多时候不是凭智商，而是看你对这个东西是不是真的感兴趣，能不能去一点点钻研，尝试各种各样的方法去解决技术难题，而且还要在一定的量产与成本可控的条件下。”易港说。如今，钛虎主攻高性能一体化关节/执行器，延展到轻量级协作机械臂、人形机器人/外骨骼、灵巧手等，其产品主打高扭矩密度、体积小、重量轻，具备无框电机、减速器、驱动器、编码器自研设计能力，拥有机器人所需要的所有关节，可以说是最为全面的产品线。

如果从更全局的角度来看，人形机器人最核心的是软件+执行器，软件负责感知和决策，本质上与自动驾驶类似，都需要先感知环境，然后做路径规划和决策。而在硬件层面，也就是机械设计层面，最关键的就是执行器，它相当于机器人的“关节和肌肉”，让机器人可以做出各种动作，尤其是人形机器人，它的执行器数量要远远高于传统工业机器人，也是人形机器人的设计难点和重要成本项。

如果只看机器人的硬件成本，其中占比最大的就是一体化关节，它集成了伺服电机、驱动器、减速器和一些控制模块等。在传统工业机器人中，这些伺服电机、驱动器、减速器等部件并不需要太集成，它们可以在空间上各自分立，通过种种线缆和连接件进行连接，体积重量大。但人形机器人不可能这么做，而一体化关节/执行器的定位，就是在设计层面，将它们集成为一体化，实现更小体积、更轻重量、更强扭矩性能。

人形机器人还有一个特殊的核心零部件——灵巧手。它高度仿人手，是人形机器人执行动作的最终零件，十分重要且复杂，面临的最大难题是要在极小的空间内，驱动自由度极多、配备功率密度高、控制精度高的电机，对其性能要求极高。

比如特斯拉Optimus机器人，和人手一样同样使用5个手指，拥有11个自由度，拇指采用双电机驱动弯曲和侧摆，其它四指各用一个电机带动。电机采用蜗杆传动机构的目的，与腿部直线伺服如出一辙，采用机构自锁降低能耗。为追求形态美观及自适应性，手指采用拉线KG），和自适应抓取（能够抓取不同形状、尺寸的物体）的能力，可完成搬运、浇花等动作。这基本上就复制了人类手掌的功能设计。

4年前，易港还自主研发了一款灵巧手，“我也没想到这款产品在今天那么受欢迎，如今回头看，其实这是现在三大主流结构中的一个，我们当时为了做假肢，结果相当于开创了一个结构派系。”

在灵巧手的传动结构中，有奥托博克式的直线年就实现了量产。另一种主流结构是拉绳式，类似于模仿人体的筋腱，拖一根绳子来传动。还有一种钛虎的专利，基于平行齿轮、锥齿，再加上三连杆的结构。“如果从美观度、抗冲击性、装配难易程度、成本等各个方面来看，第三种方案有其优势。”易港认为。

机器人上半身的发展，直接决定了它现在能做什么。当然灵巧手的设计和应用并不容易，在这项技术成熟之前，采取夹爪（“两爪”、“三爪”）的方案也未尝不可，需要有选择性。比如银河通用在便利店场景的实际应用中，给机器人装上了吸盘和夹爪两种末端执行器，机器人可以自主决策需要用哪个，例如在需要拿矿泉水瓶时，夹爪就可以完成任务，但在抓取零食时，吸盘会更合适。

同时，银河通用还在针对灵巧手展开研究，因为面对过宽（夹爪的夹距有限）或光滑的物体，以及柔性物体（比如晾晒衣服，需要用衣架把衣服插起来）、复杂场景（拧瓶盖）时，灵巧手或许才是终极解决方案。

相比于AI大模型，在人形机器人领域，硬件的快速迭代也有很重要的影响。拿电动车产业举例子，传统燃油车至少需要三年时间的研发、七年时间的全球销售，才能收回成本开始盈利。但现在中国的智能电动车企业，已经能做到两年就迭代一个平台，因为如果不能在两年之内迭代一个平台的话，这个车型无论是在智能化方面，还是在续航里程方面就都跟不上。在光伏产业也类似，每隔几年就会有一个重要的技术迭代。一个新产线如果不能在两年之内实现产能交付，基本上也会被淘汰。

而机器人硬件水平每迭代一次，很多核心性能都会跃升一个台阶，而这恰恰是中国供应链的优势。比如减速器、电机的升级，对精度、力控都有决定性影响，这能极大升级机器人的可操作性。一旦研发成熟，到达制造环节，根据大多数制造业的规律，每当产量翻倍，成本将会降低10-30%，这在光伏和锂电池行业中，均有所体现。

“展望未来，整个机器人产业链，很可能比现在的汽车产业链更高一个量级。”易港说。

“数据是AI下一个发展阶段的最大助推力，但真实世界的数据是远远不够的，这需要仿真数据来弥补。”光轮智能联合创始人兼COO杨海波说，“我们认为很快就能找到Scaling Law，那么机器人也将很快变成数据驱动，这也是我们做仿真合成数据的初衷。”

GPT-3.5之所以能产生划时代的突破，核心在于Scaling law，而这离不开数以百亿的训练数据。训练AI大模型的数据在互联网上容易获取，但对于机器人来说，直接可用的数据几乎为零。

能否获得高质量且足够便宜的数据，是当下制约机器人发展的瓶颈，也是拉开公司之间竞争的重要手段。前车之鉴是Everyday Robots，它曾是谷歌的明星独立项目，但在今年2月被谷歌因成本控制而解散，并入谷歌其他部门。

造成Everyday Robots成本高昂的一个重要原因，就是数据采集成本过于昂贵。OpenAI曾经也有一个机器人部门，但后来放弃了，问题也出在数据收集上。

为什么采集成本这么高？主要是因为Everyday Robots基于真实环境来收集数据。谷歌为了训练PaLM-E，用了13台机器人，收集了17个月，才拿到足够的数据量，如果是在更复杂的工业场景，数据采集成本会更高。

“目前对于人形机器人来说，主流的数据获取手段分为两种：一种是真实数据，另一种是仿真数据。”杨海波认为。

真实数据就是构建一个采集数据的基地，在里边搭建相关设备，比如遥操作、动作捕捉等等，比如家庭场景里的做饭，捕捉方方面面的动作数据，然后再对合并数据进行一些泛化，以及清洗，最终给到模型。

仿真数据则是完全在模拟器中进行的。首先用虚拟建模的方式，把环境场景搭建起来，然后再把机器人虚拟化放进去，形成一个动态的场景。这里面的一切物体，建模都要尽量接近真实，比如需要做一个苹果，那就要制作出大量不同的具体形态，比如不同的光照条件、不同的位置条件、不同的摩擦力情况等等。

从这样动态场景提取出来的数据，其实是一张张类似于“图片”的数据集，在这些“图片”上也需要补充针对性的标注，再给到机器人公司做算法训练。这个训练过程，就有点像特斯拉在训练FSD时，拿人类司机的真实驾驶视频训练。

仿真数据最核心的要求，就是尽可能的接近真实，真实度、泛化度都是重要指标。如何符合物理规律，是目前的一个难点，比如一个物体是软还是硬，这就需要更复杂的参数设计。

由于仿真数据多数是通过视觉，训练过程往往是，首先需要判断出来这个物体是什么材质，比如是个杯子，然后再去设计多大的力量，这个过程也可以加入大语言模型的能力。但这与在机器人的传动结构中，加一个力触觉是不同的技术方向。

所以，仿真数据与遥操作各有优劣。遥操作的优势在于，在将采集到的数据用于训练机器人后，这一项任务的成功率会很高。但劣势也很明显，机器人的能力缺乏泛化性。

比如在特斯拉训练机器人分拣电池的例子中，就是通过人类带着VR眼镜，去遥控操作机器人采集而来的。通过这种方法训练出来的机器人，几乎只会重复遥操作时的动作，比如把一个电池放到三乘三的盒子里，但当你把电池换成矿泉水瓶，同时将盒子换成更大的四乘六时，机器人就不知道怎么办了，这时候就又需要重新进行遥操作再去训练。在没有形成海量数据的时候，每做一个新动作都非常吃力，数据采集成本很高，并且难以在短时间获取大量数据。

与遥操作对比，仿真数据的优劣势几乎相反。首先可以用低成本生产海量数据，同时机器人在经过训练以后，能力是泛化的，因为可以仿真制造一系列所需要的场景和交互，以使机器人可以解决各种问题。

当然，仿真数据的劣势也很明显，问题主要出在仿真还不够接近真实，当把通过仿真数据训练的机器人用在真实场景中时，存在一定的失败率，比如在抓取任务中，因为光照、环境等各种因素的改变，机器人可能以为抓到了，但其实没抓到。

提高数据规模，尝试将大模型训练中的Scaling Law，应用在机器人仿真训练数据中，可能是准确率不足的解决之道。

在王鹤看来，他在一开始尝试用仿真数据时，也遭遇了准确率不足的问题。不过他很快意识到，当时只用了一个百万级的数据集，如果把规模扩大会怎样？

“我们自己的实验发现，比如在抓取这个任务上，在用灵巧手抓取没有见过的、随机乱放的物体时，在有十亿次抓取数据的情况下，机器人的成功率能到 86%，如果数据量缩到万分之一，也就是 10 万次抓取时，成功率就只有 58%。这说明具身智能也有清晰的 scaling law，它对数据有更大渴求。”王鹤说。

“传统的仿真是以测试为中心的，而为具身智能服务的仿真，则是需要以训练为中心。”光轮智能CEO谢晨说，他认为好的仿真数据首先要有自我真实性、效用性评测能力，如果没有这些，仿真数据也很难让客户的算法有所提升。谢晨曾在英伟达负责无人驾驶仿真，国际首创将生成式AI融入仿线开发落地仿真数据，后选择回国创立光轮智能。

“仿真数据不会取代真实数据，而是放大它。” 他认为终极的Data for AI，会是真实的人的示范数据，与仿真数据能力的乘积。

过去10年，AI给太多行业带来过希望和失望。而今天的人形机器人，正越来越逼近临界点。虽然机器人至今没有清晰的产品形态，但经纬创投看到每一家机器人创业公司都在尝试各自的应用场景，像已经投资的四家机器人软硬件一体化公司（宇树科技、智元机器人、银河通用、星尘智能），再配合着产业链上游的核心一体化关节（钛虎机器人）、仿真数据（光轮智能），都在不同场景下有非常好的应用。

这一波人形机器人公司的短期目标，都是快速占领各自的应用场景，谁先把一个细分场景做好，积累出足够多的数据，就能建立护城河，再去拓展新领域，最终走向通用化。

而机器人的发展离不开硬件。与欧美市场对比，经纬创投看到国内很多初创公司的硬件迭代能力，比海外要快很多，成本控制能力更好，在某些硬件细节方面超越了海外同行。

全球化几乎是中国通用机器人公司的必选战略，且与电动车行业不同，其在全球化中遇到的障碍会更小。其中一个原因是，几乎没有一个国家具备有规模的机器人产业，此时出海不会冲击当地的产业结构，只要产品质量和应用体验足够好，出海溢价可能达到国内的5倍以上，这将为中国通用机器人企业提供广阔的国际市场。

人形机器人能发展到今天的位置，来之不易。“我记得在2016年的时候，那时我还在百度，有一次参加完一个NLP的会议，结束之后充满了挫败感，感觉好像这辈子都看不到真正的应用，你也不知道那时的投入到底是不是对的。”星尘创始人来杰回忆，“但我也经常反思，从我过去十几年对未来的预判里，我发现AI和机器人整体的发展速度，又是大大超出我的预期了。短期内你永远会看到很多困难，但这么多聪明的头脑，其实在解决一个又一个问题，产生了一个又一个技术突破，就像有一只巨大的手在促使这个行业往上升，这给我带来很大的能量，让我一直坚守在这个行业里。”

“技术是一个日新月异的事儿，你无论是在做你的老本行，还是做一件新事，你都有可能明天就被更新的技术给‘卷’了，AI和机器人行业尤其如此。与其说按兵不动，还不如主动的去创造变化。” 光轮智能创始人兼CEO谢晨说，“所以在我看来，现在的创业成本其实比之前要低太多了，因为现在不变的成本太高了。”

另一方面，虽然最终的目标是通用化，但在当下早期的发展阶段，机器人的产品定义并不明确。由于劳动力和任务需求是多元的，人形机器人公司短期内也不会只有唯一的巨头，将会有很多公司围绕不同细分市场，走不同的技术方向，积累该场景下的数据护城河，这种“条条大路通罗马”的局面会维持一段时间。

一些公司选择把主要精力放在机器人的“上半身”。比如银河通用选择的落地场景是无人值守药店（特别是夜班），其首代产品盖博特机器人，“下半身”就采取了轮式底盘+折叠本体的设计。之所以采取这样的设计，首先因为轮式底盘在零售场景里，已经完全可以覆盖绝大部分应用。而折叠的设计，往上可以摸到2.4米，可以覆盖最高的货架，机器人能拿到所有货物。

往下也可以摸到地面，比如当有产品不小心掉到地面上时，机器人也可以自己捡起来。这些都是目前机器人的双腿结构，比较难解决的问题，而在当下集中精力先研发“手”，可能能够率先实现应用价值。

星尘智能创始人来杰则将自己的机器人产品定义为“助理”，辅助人，而非替代人。首要的场景就是那些脑力劳动更多，但却经常陷入一些重复操作的事情上。最典型的例子就是生物医疗和化学实验，这些都是需要高智力劳动，但却绕不开重复操作的领域。此时一个合格的机器人助理，可以解放这些教授、博士们双手，他们只需要设计实验，而所有操作都可以让机器人准确无误、不分昼夜的去完成。如果给一位生物教授配10个机器人助理，他用于创造的时间甚至可以翻几倍。

来杰也非常重视“软硬一体”的能力。得益于在腾讯RoboticsX机器人实验室的经历，他非常重视架构，“我们与腾讯RoboticsX机器人实验室的架构就很相似，一半主攻机器人软硬件一体化，另一半强调用AI算法去做感知和运动控制，以此来探索AI和机器人的强耦合。”

星尘融合了触觉感知进行力控抓取，并结合规模化数据综合训练，包括人体动作视频演示、动捕、遥操作采集等方案。来杰非常重视传动结构中的刚、柔结合，也装入了一些传感器以在传动过程中，能一直监测力的传输。比如机器人在削黄瓜时，星尘的机器人并不是去估算轨迹，而是与人类一样，通过感知削皮刀在压到黄瓜上时，力量的大小，来控制力量的输出，这种特殊的传动结构，能使精度更上一层楼。

“当下，离我们想要的具身智能之间，还有两个重要的Gap（差距）没有解决。”星尘智能创始人来杰说。

第一个Gap是AI大模型和机器人之间，有时候一些问题的产生，并不是单纯靠扩大数据规模，或是算法就能解决，而是需要在机器人层面去进行提升，这是硬件带来的。

第二个Gap是在硬件本身的表达能力足够的前提下，AI如何更好地结合硬件的能力。比如说AI是否可能完全自主地进行学习和尝试？假设有一个机器人在办公环境下，它本来什么都不知道，只知道一些基础动作，然后让它自己去建语义地图，自己去理解环境，自己去观察其他人的操作，然后把所有动作学会，这就跟我们人类很像。当然，这也是Yann LeCun所提出的“世界模型”。

彭志辉在最近的发布会上，对整个具身技术成熟度等级，做了从G1-G5的划分，这类似于无人驾驶的L1-L5：

上一篇:【48812】神七搭载固体光滑资料已正式启封剖析作业打开

下一篇:全球每10台中有7台来自我国！国产“地下航母”掘进世界前列：刀盘、主轴承做到世界最大