12万的马杀鸡机器人、踹不倒的钢铁小强……这届AI的花活儿真的能落地了
2024-07-11 01:30:06智能制造解决方案

  大模型的厮杀日趋白热化,而世界人工智能大会(WAIC)就是AI界的狂欢,AI界的春晚。

  7月4日,WAIC在上海世博展馆开幕。在主论坛上,马斯克、姚期智、李彦宏等AI大咖齐聚一堂;在展馆中,AI战场从模型一步步卷到了应用,又从软件卷到了硬件——2024年的展馆新设机器人专区,有25款人形机器人亮相。

  上海的酷日与冰雹来得猛烈,AI之火来得更猛烈:大会的几十场论坛早早就被约满,媒体们带上直播的长枪短炮,AI博主们纷纷在展馆闪现并与网友见面,也有求职者直接到大会现场找工作、应聘企业。

  在展会上,你可以跟AI一起玩狼人杀,跟着数字人一起同台跳舞健身,还可以让AI老罗帮你直播带货。大量的AI应用,悄然跃过了纯展示和Demo阶段,从手机App延伸到到词典笔、电视等等硬件中,进入到生活的方方面面。

  你还能看到特斯拉的赛博皮卡Cybertruck,和特斯拉的人形机器人Optimus合影......

  数不清的具身机器人中,有会写书法的、会做穴位按摩的、会叠衣服做家务的,更不可思议的是会跳女团舞的......

  时隔7个月,特斯拉Optimus第二代产品终于亮相,这次自然也吸引了不少目光。这次,Optimus毫无疑问变得更强了。

  据特斯拉工作人员介绍,Optimus如今在直立行走的基础上,走路的速度提升了30%,而且,它的十个手指还“进化”出了感知和触觉。这在某种程度上预示着,它不仅仅能轻握脆弱的鸡蛋,还可以搬运沉重的箱子。

  特斯拉还在尝试把Optimus用到他们的汽车工厂中,替代人类。比如,借助和特斯拉汽车上类似的视觉神经网络和FSD芯片,Optimus已经能够模仿人类的操作进行电池的分拣训练。特斯拉方面称,明年将会有超过1000个Optimus要进厂工作。

  遗憾的是,这次其他家的机器人都在现场整花活,唯独Optimus被关在了一个玻璃柜子里面,只可远观,不可亵玩。

  这次,“宇树科技”则展出了他们的Unitree H1人形机器人。据说,这款机器人是全球首款能在原地后空翻的人形机器人,而且还是纯电驱动。

  在现场,宇树可以还展示了他们的一系列机器狗产品。这些机器狗能自如做站立的动作,并且还能连续原地侧空翻,每翻一次,现场都惊起“哇”声一片。

  通用足式机器人公司“逐际动力”的标杆产品,是一款用脚踹都踢不倒的双足机器人。

  运动的稳定性,对机器人执行任务、打工干活儿是关键。要走得稳,才能代替人类上刀山下火海。

  在地形复杂、坑坑洼洼的山路上,而且是在完全陌生的野外环境,这款机器人能走石子路、过沟渠、爬草坡,甚至人怎么用棍子打它,都不会倒。

  在大会现场,这款产品几乎赢得了机器人区最多的目光。观众用各种方式欺负这款双足机器人:拉、拽、踢、踹......

  可怜的机器人哪怕被人踢得快跪下了,甚至都被地上的坎儿绊了一下,都没倒,继续还能双替调整,站起来。

  在软件方面,需要结合更实时、更精准的地形感知信息,同时需要迭代全身的运动控制算法。通过对全身动作的实时规划,机器人的手臂与腿部的动作更加协调,身体在运动过程中的晃动显著减小。

  灵活的手,造就了人类使用复杂工具的能力。而对机器人来说,灵活的手决定它是否能代替人类做各种操作。

  在人类的日常家务中,叠衣服其实难度很高:对手指关节的灵活性、对柔性变形衣物的感知能力、操作的力道和角度要求,都很高。

  穹彻智能企业成立于2023年11月,该公司由非夕科技拆分而来,初创团队主要由非夕科技CEO王世全和上海交大教授卢策吾等人组成。卢策吾曾是著名AI学者、斯坦福教授李飞飞教授团队成员。

  不过,据《智能涌现》观察,穹彻智能的这双灵巧手叠衣服比较费时,三分钟才刚能把衣服拉起来。机器人帮你做叠衣服这种高难度家务,在效率暂时还比不上人类,但是曙光应该就在眼前。

  当你腰酸背痛,又不想出门去按摩店,如果有一台机器人在家为你做按摩,岂不是爽呆了?

  “睿尔曼智能”的这款康养机器人,采用仿人机械臂,能对人体上不同的穴位进行按摩。跟传统的按摩器大不相同。

  传统的按摩器,按摩的动作是固定的,只可以调档位。在同一个档位和模式下,按摩的手法、动作与力道是一样的。

  据现场工作人员介绍,这款机器人录入了400多种不同的人体身体的数据,可以自动判断当前床位上人的穴位位置做按摩。此外,机器人还能调整按摩的力度、温度和时间。

  用户还可以有个性化定制按摩,比如当你近期感觉肾脏欠佳,就可以设定让机器人重点给你敲打肾经。

  价格也帮大家问过了,标价每台12万元,在场的《智能涌现》小伙伴们人人都心动。

  在兴趣社交社区平台Soul的“狼人觉醒”游戏中,真人与AI同上牌桌,一起尔虞我诈。

  “但凡你要为狼人做事情的话,你都会说两句话对不对?结果你直接划水。”在一次游戏场景里,一个AI角色信誓旦旦地分析道。

  Soul社区在今年发布了“狼人觉醒”的站内游戏,AI扮演角色,和人类玩家一样,在狼人和村民的角色中互相博弈。

  据了解,该游戏基于Soul自研的语言大模型Soul X,采用强化学习技术,在游戏各个阶段让AI角色作出包括伪装、信任、领导与对抗等精准拟人决策,还能支持多角色扮演,也能选不一样的音色。

  这次,“二次元老家”B站,亲自用AI生成动漫的视频版,暂解动漫迷的苦守TV化之苦。

  在哔哩哔哩漫画上,B站上线了“动态漫”模式。所有的漫画都可以丝滑地切换成TV模式,漫画分镜连成了视频,角色拥有了肢体动作,台词也转换成了字幕。

  没想到吧,B站也悄地自研了大模型——B站小伙伴向《智能涌现》介绍,无论是“动态漫”还是数字人,都是基于B站自研的大模型能力。在展会现场,B站也开放了自研大模型的对话能力,用户扫码即可进入大模型的直播间聊天。

  不想去健身房、在家又怕学不会动作的社恐们,现在可以在家跟着数字人同台健身了。

  腾讯就推出了体感健身应用“舞动极光”。用户不需要额外购置设备,只需要要把手机连上一台电视/电脑,就可以跟着虚拟角色一起健身。

  舞动极光使用了AI动作捕捉技术,依靠机器学习来推断出身体结构运动。在真人模式下,你自己的影像,会与虚拟角色的影像一起,同时出现在台上。

  比如,虚拟角色是喜羊羊,喜羊羊怎么抬手、踢腿,你就跟着抬手、踢腿,你的动作会显示在屏幕上的真人影像上,实时反馈,动作正确就会奖励得分,像游戏闯关一样。

  如今的AI智能体,已经不单单是二维屏幕上跟你对话的软件,而是有着三维体积感的数字人——能站在你面前,看到你的相貌,像活人一样跟你聊天,夸你今天的穿搭,为你唱歌。

  你面前的关小芳,是快手的虚拟数字人,站在如同透明液体一般的VR显示设备里,隔着一道玻璃,但你仿佛能触碰到她。

  展会上的关小芳数字人,当你跟她聊天、希望她给你唱首歌,她会用知性的声音唱道:“拥抱的温度,只有你清楚。”这个有着3D体积感的数字人,仿佛伸手就能拥抱你。

  快手开发关小芳智能体之初,是用来当带货主播。借助虚拟演播助手,用户只需要站在摄像头前,面部表情和肢体姿态就可以被快速捕捉与识别,并实时呈现在直播间的虚拟角色上,能够和直播间的观众进行实时互动。

  在AI的加持下,VR/AR、元宇宙重新焕发活力。元宇宙不仅能让数字人带货,还让《头号玩家》里人类与虚拟人一同生活成为可能。

  真实世界里的罗永浩,已经今年慢慢从直播界淡出、降低了直播频率。没关系,AI罗永浩可以替他干活儿——大模型独角兽公司“智谱AI”发布的数字版老罗,就是用罗永浩真人语料库训练出来的AI智能体。

  只要有电,AI老罗可以24小时无间歇和你聊天,还可以24小时干活儿做直播——这可比真人老罗有性价比多了。

  罗永浩的幽默诙谐,慢慢的变成了他直播带货的风格护城河。那么AI罗永浩能模仿真人罗永浩的风格精髓吗?

  “AI领域火得一塌糊涂,机会多如牛毛,比如AI在医疗健康、金融、零售、制造业等行业的应用,都是创业热点……但别忘了,创业不是光靠点子就能成功的,执行力、团队、资金、市场定位,一个都不能少。有兴趣的话,可以进一步探索一下,也许下一个改变世界的就是你了。”

  这款能解放教师双手的智能批改系统,来自猿力科技自研的AI大模型多语言智能批改技术。

  批改作业和试卷,最怕的就是因为错批、漏批而影响到学生对错题的复盘。猿力科技的智能批改系统,已经学习了海量青少年的书写笔迹,进而能够更准确地读懂学生的答题字迹。

  仅仅是批改还不够,这套系统还担当了错题讲解员的角色。根据上传的作业,系统界面能够实时出现批改结果,并提供智能解析和视频讲解。

  在海外受欢迎,也是因这款懂十几种语言的系统,能解放多国教师的双手。除了中文,英语、日语、葡萄牙语、西班牙语、法语、德语、俄语、越南语、印尼语、西班牙语等多种语言的作业,AI也果断拿捏!

  去年,网易有道就开始用自研教育大模型“子曰”,给词典笔“换脑”。这次新推出的词典笔X7,就注入了会做、且能分布讲解所有科目的能力。

  相当于,曾经偏科语文和英语的有道词典笔,终于换上了一颗全科教师的AI大脑。

  使用方法也很简单,只需要用机身扫过题目,词典笔内置的AI摄像头就能识别、读取题目信息。

  相较于搜索引擎或市面上其他直接给出答案的教育产品,X7的特点在于,内置了有道AI教学应用“小P”老师,强调了给孩子“讲题”的能力。

  比如,下图中有关浮力的物理题,X7就分了两步来讲解。孩子如果有不懂的地方,还能用语音输入相关疑问,如“为什么排出水的重量就等于浮力?”

  X7上也搭载了有道的AI虚拟人口语教练“Hi Echo”,孩子可以与虚拟人老师Echo进行英语口语的实时联系。发布了一年的Hi Echo,也推出了语气更可爱、更会夸夸的儿童版模式。

  不过,2023年8月9日,有道才刚发布搭载基础AI学习功能的有道词典笔X6 Pro。时隔不到一年,即便功能升级,X7还卖得动吗?

  网易有道工作人员告诉《智能涌现》,消费电子市场正处于缓慢的恢复期,AI在商业化布局上承担的最重要角色,是拉新,而非带动老用户的换机。而且,家长们不希望孩子们天天玩手机,这也是购买新硬件的重要动力。

  当然,产品的吸引力最终不仅在功能,还在价格——升级功能的X7定价为999元,和X6 Pro(售价1199)相比,加了量还减了价。

  中科曙光作为国产智算的领军企业之一,打造了坚实的AI算力基础设施,具备从底座、平台、服务、生态到应用的全栈能力,致力打造新“智”生产力引擎。

  其中的一大亮点是曙光人工智能基础软件系统DAS,它由基础算子、框架工具和扩展组件三部分构成,同时下层依托基础硬件系统及开发工具栈,上层支持广泛AI应用,为用户更好的提供包括模型训练、推理落地等全领域智能计算服务,为大模型迁移和优化提供了新捷径,帮助客户更高效快速地实现AI技术的落地应用。

  在通用显卡这一领域,国内少数或可从功能上对标英伟达的GPU芯片——摩尔线程,现已从千卡集群,升级到万卡集群了。

  摩尔线程发布的万卡集群,叫夸娥(KUAE),能够承载万卡规模,具备万P级浮点运算能力,能用来训练万亿参数级别的复杂大模型。

  对于显卡来说,多卡互联可以拓展算力,那么从千卡规模拓展到万卡规模,算力便更上一个台阶。据介绍,构建万卡集群并非一万张GPU卡的简单堆叠,而是一项复杂的系统工程。

  夸娥万卡集群很注重生态兼容性,支持多种大模型架构,基于MUSA编程语言和完整兼容CUDA能力,提供了生态适配工具。

  而且,这个万卡集群还很稳定,平均无故障运行时间超过15天,最长可实现大模型稳定训练30天以上,周均训练有效率在99%以上。

  WPS Al是金山办公旗下一款具备大语言模型能力的AI应用,2023年11月开启公测,锚定AIGC(内容创作)、Copilot(智慧助理)、Insight(知识洞察)三个战略方向发展,支持文字、表格、PPT、PDF等主流办公组件,提供快速起草文档、处理复杂函数公式、辅助阅读长文本等AI功能。

  在用户写作过程中,AI陪伴实时为用户更好的提供后文写作建议,有效帮助用户提升文稿质量,快速完稿。AI伴写打破了常规大模型写作中对话框的限制,且无需跳转查询,不会打断用户写作思路,模仿用户的文风,以AI写作助手的身份猜测你想要表达的内容,从而写出专属于你的文案。

  展台工作人员介绍,本次WAIC展会WPS AI经过一年的摸索,将会全新发布4个AI办公助手能力。

  播客正逐步成为许多人获知科技资讯、促进自我提升的重要渠道。根据最新发布的《2023喜马拉雅中文播客生态报告》显示,“前沿科技”类的播客内容占据80后人群收听榜的TOP1。

  喜马拉雅上,有各种围绕AI的线年AI新趋势”、“谁是AI时代的新霸主”、“个人如何把握AI新机遇”等,邀请经济学家管清友、经济学家向松祚、科普作家严伯钧、科技作家涂子沛等知名主播发声,与人民公园说AI、新商业相对论、科技行者等科技领域主播一起探讨。

  此外,喜马拉雅上还有各种AI相关的专辑:《AI实践真知课》、《山姆奥特曼传》、《芯片的未来》、《数字文明系列》、《“AI教母”李飞飞自传》等。

Copyright © 2018 乐鱼官网app平台游戏下载 All Rights Reserved
网站地图 备案信息: 湘ICP备14017517