8月底,在北京一家餐厅,《21CBR》记者见到跨维智能创始人贾奎。科研、教学、创业……他的日程表排得满满当当。
贾奎是学者型创业者。他毕业于伦敦大学,获得计算机科学博士学位,曾在多家高校执教,是人工智能、计算机视觉等领域专家,发表论文百余篇,在TIP、TMLR等学术期刊担任副主编。
2021年6月,贾奎创立跨维智能。从学者到创业者,从技术到产业,贾奎称,转型有两个原因:
一是,近年来,AI“大厂”以丰厚的算力、数据资本发力,学界有滞后于产业界的趋势。
二是自己也想尝试新方法。“学术上,只要论证长期有用就行了,而企业的创新,要产生真正的社会价值,要考虑针对的人群,满足的需求,产品的功能、性价比等因素。”
贾奎带领的跨维智能团队,研发人员占比达70%以上,核心小组成员多拥有顶尖高校人工智能专业博士、硕士学位。
以自研的DexVerse™具身智能引擎为技术底座,跨维智能已形成包括纯视觉空间与具身智能传感器、新一代机器人控制器、PickWiz软件、高精度通用移动操作机器人等在内的产品矩阵,并实现商业落地。
我选择了一条小众赛道,将人工智能技术应用于三维空间。图像是一个二维平面,三维就像一个杯子,是曲面、不规则图像。怎么样处理这样的信号?
这需要运用机器学习、计算机视觉、图形学、机器人等交叉学科的知识。直至2015年,学术界才开始研究此类问题。
早期,团队成立了“几何感知与智能实验室”。当时,大厂尚未涉足这一领域,我们是国内最早将AI应用到三维空间的团队。
文本、图像,是二维的,网络上有现成的海量数据。三维空间,是立体的,包含位置、角度、尺寸等信息,需要精准标定,不能采用之前的方式获取数据。
举个例子,如果目标是让机器人抓取世界上任何一个鼠标,团队就需要集合成千上万、甚至世界上所有鼠标的数据。这在某种程度上预示着,实验室需要从早到晚,去不同的环境里采集数据。
Sim2Real是适合空间智能、具身智能、机器人的范式,借助物理引擎、物理仿真,它能自动计算、自动生成数据,来训练大模型。
就是说,鼠标上面的颜色、纹理、材质,全部是解耦的。在引擎空间,你只用改变材质空间参数,就可以把一个木头鼠标变成金属的。
到了2020年,我发现,做AI研究,需要足够多的算力、数据及场景,高校能做的事情有限,不如大厂。
随着技术逐步成熟,我于2021年开启创业之路。创业三年多,我逐渐适应了企业家身份。
经过多年历练,我的能力变得更综合、全面,脸皮厚了。有些性格弱点,克服不了的,能够最终靠其他人弥补,认清自己,有所不为,有所不能。
我们一开始就是按照Sim2Real(simulation to reality,从仿真到现实)的方式,希望能够通过智能的“眼睛”,感知空间,实现通用的技能。
一家公司的CEO,需要具备技术洞察力,选择恰当的技术路径,针对某个场景或痛点,拿出解决方案。在走访一系列应用领域后,我选择从人机一体化智能系统开始。办公司、在大厂上班与教书,是三种完全不同的生活。我既要找准商业化场景,也要找到合伙人。
跨维智能联合发起人吴迪,是相机硬件专家,曾在华为、腾讯等公司工作,拥有十余件发明专利。依托原有经验及技术积淀,跨维推出了一系列3D成像和感知设备。
做销售业务,需要找有经验的。联合发起人解锐,是一名连续创业者,曾担任动视云科技联合发起人,为通信、云计算和AI领域专家。
几人组团创业,致力于给机器人安装智能“眼睛”,提升空间感知能力,锤炼智慧的“大脑”,习得“具身智能”技能。
目前,在多个商业场景中,跨维智能已经实现了利用100%合成数据,在毫米/亚毫米的操作精度要求下,达到99.9%以上的任务成功率。
在虚拟空间层面,我们不断锤炼“大脑”——底层自研的DexVerse™具身智能引擎。这是公司的技术底座。
在工业和一些商业场景中,我们已实现了无需研发人员介入的自动化操作。只需输入一个操作对象,系统就能自动生成数据、标注计算,并在线传递给相应的AI模型进行训练。
整个过程无需存储数据,高效且精准,是当前实现具身智能通用化技能的最佳路径之一。
传统的3D相机,需要光线D信号,作用距离有限,且容易受环境光的影响而跨维自研的纯视觉空间智能传感器,利用两个相机从不同角度捕捉图像,可以在复杂或半室外强光条件下成像,提升视觉系统的稳定性。
这套3D成像和感知设备,能安装在机器人身上,适配主流机械臂与机器人,指挥其在工业和商业场景里运作。
上一代的控制器,做一个从A点到B点的简单动作,都需要机器人工程师单独写一个程序。它没有眼睛,通过特定程序,精确地做动作。
新一代机器人控制器,像人一样有大脑、眼睛,可以指挥胳膊和手的动作,理解自然语言。
我们在研的新一代机器人控制器,有眼睛,还能通过自然语言的方式沟通,自动理解任务,并将其转换成机器人能执行的代码。
在工业柔性装配领域,即使要抓取的东西是无序的,Ropilot也可以指挥机械臂去完成动作。
如果机器人一定要做好几个动作,比如把内存条插入电脑,中间有几根线挡着,其也能灵巧地拨开线,完成任务。
举个例子,目前室内扫地机器人没有胳膊,只能在地上操作。基于Ropilot产品,其在酒店场景下,能够实现清扫马桶、更换牙刷等复杂动作。
市场上存在着大量人不愿意干或者不能干的场景。现在,年轻人宁愿送外卖,也不去工厂干活。这种情况下,客户有强烈的需求,将机器人变得自动化、智能化、无人化。
商业变现上,跨维智能出售成像感知套件,供应给集成商,安装到机械臂、灵巧手上,再应用到家电、汽车零部件等行业。
随着能力的增强,公司未来能够支撑更多机器人的技能,这一个市场会慢慢的大,工业、农业、商业……人类总是希望智能体在生活中辅助我们。
对一个CEO来说,最重要的是具备洞察力,选择正真适合的技术路径,找到志同道合的人,把产品做出来。
对一个企业来说,永远的话题是:下一个利润增长点在哪里?要找到有决定价值的商业场景,在关键时间节点,找清自己的生态位,每一步都要看准。
全体股民注意!10月8日起银证转账时间可提早至 7:30 部分券商前调隔夜委托时间
A股罕见!任泽平:下周开盘即收盘!中国资产被爆买,券商疯狂加班,还在夜市摆摊
明日A股即将开市,分析师喊话:现在是牛市初期!未来量能的变化或是进行短线
港股终结日线六连涨 恒生指数收盘跌1.47% 机构发声:“暴力拉升不可持续”
国庆开户暴增 上交所延长指定交易时间!券商:并非取消开盘集合竞价 系方便新开户账户的交易安排
滚动更新丨港股收盘创2022年2月以来新高 中芯国际国庆假期涨近60%
上一篇:移动机器人操控器