科技云报到原创。
从ChatGPT的语言魔法到DALL·E的图像创造,虚拟世界的AI已无处不在。但当我们把目光转向现实世界,一个新名词正引发热议:具身智能。
具身智能被誉为“AI的下一站”,让机器不仅会“思考”,还能“行动”——从工厂的搬运机器人到养老院的陪伴助手,甚至是太空探索的机械先锋。马斯克宣称,特斯拉的Optimus将是“通用智能的载体”;谷歌DeepMind则押注机器人来破解物理世界的难题。
然而,现实远比愿景骨感。2025年,具身智能的商用化仍步履蹒跚:成本高企、效率低下、数据瓶颈频现。波士顿动力Spot在巡检场景表现不俗,但价格高达20万元;优必选的Walker搬运箱子耗时数分钟,远逊于人类工人。
如今,技术已将其推至产业变革的商业化临界点。但我们仍必须回答三个关键问题:需要怎样的颠覆性创新,才能赋予具身智能真正的泛化行动能力?又如何跨越从“技术可行”到“商业成功”的鸿沟,找到其不可替代的价值锚点?当“数字认知”的潜力被空前释放,我们如何将AI其转化为“物理世界”的真实生产力?
具身智能与“真”场景的碰撞
自2023年人工智能应用爆发以来,具身智能就成为业界公认的一个重要应用方向。近两年,多地政府都在设立机器人产业发展投资基金,入局者日益增多。截至目前,苹果、华为、百度、vivo、富士康、小米等都已经在该领域布局。
进入2025年,具身智能再次掀起热议。一方面,具身智能企业的最新动作引发瞩目,例如,宇树科技的Unitree H1和G1人形机器人于2月12日在京东旗舰店上架开售;另一方面,大模型的更新也在推动应用的发展。
从全球范围来看,机构预计到2027年,全球人形机器人市场规模将达173亿美元,复合增长率为63.5%。
高盛数据显示,在理想情况下,预计到2035年,人形机器人市场空间有望达到1540亿美元,约合11037.3亿元人民币,这一规模相当于2021年智能手机市场的三分之一。花旗银行发布的最新报告预测,到2050年,全球人形机器人市场规模将达7万亿美元,全球人形机器人数量将达到6.48亿台。
具身智能的价值最终要靠场景落地来体现,目前多个传统行业已经尝到了技术红利。制造业、医疗健康、零售业、能源行业、物流行业、建筑与基础设施等领域获益尤为显著。
以制造业为例,用户(车间工人)的刚需可能是“快速发现设备故障”,但行业真场景远不止于此:它需要AI能兼容不同品牌设备的传感器数据格式,在嘈杂的车间环境中过滤机械振动的干扰信号,识别故障后不仅要提醒工人,还要联动MES生产管理系统暂停相关工序、自动推送维修工单,甚至同步更新后续订单的交付预期。
这才是契合场景的AI生产力,而非仅能识别故障却无法推动流程闭环的“单点工具”。反之,若脱离行业场景,即便AI的故障识别准确率再高,也会因无法融入生产链条而沦为“闲置功能”。
只有当AI从“用户需要的工具”,转变为“行业离不开的基础设施”,才能真正释放生产力的潜力。毕竟,用户的刚需是起点,而行业场景的落地闭环,才是AI生产力的 终点。
从“卖工具”进入“卖成果”时代
在中国,具身智能机器人的行业应用路径已日趋清晰。今年全国两会上,“具身智能”作为未来产业的重要组成部分,首次被写入政府工作报告。
3月,智能安检机器人在深圳地铁站上岗;4月,全球首个人形机器人马拉松比赛在北京开跑;目前银河通用的Galbot机器人已经应用于美团24小时无人值守药房。
蚂蚁集团旗下具身智能企业“灵波科技”于近期展示了其首款人形机器人——Robbyant-R1。R1是一款多模态感知和交互机器人,基于灵波自研具身智能基础大模型,智能硬件等,可担任导游,在药店分拣药品,提供健康咨询或执行基本的厨房任务,已在部分实际场景试点。
随着具身智能发展,未来服务于家庭的人形机器人,不仅会帮助处理日常任务,还会像超级智能大脑一样,利用云端AI来协助更多事务。而蚂蚁集团在服务领域有着多年的技术和生态积累,无论是在支付、金融还是数字公共服务领域,一直以来的目标都是让每个人的生活更便利。灵波机器人也是延续了这一核心理念:聚焦服务。
蚂蚁旗下灵波R1带来了餐饮场景演示。“机器人厨师”现场为观众烹饪四道菜品。该机器人具有多模态识别能力,能自动识别操作台上的各类食材和厨具,精准定位食材工具,从取菜、炒菜到清洁,全流程自动化,无需人工干预。
今年外滩大会期间,在蚂蚁集团主办的AI科创赛“机器人职业技能表演赛”中,机器人轮番登场,在模拟真实工业与救援场景的高难度任务中展开角逐,为现场观众展示了机器人如何成为高危行业必须可少的助手。
在工业和救援场景中,机器人和机器狗可以替代人类完成巡检、现场清理等危险工作,比如完成开关门、识别按钮、拉闸报警等电箱操作。转战救援现场后,机器人通过多模态传感器扫描生命信号、清除石块,最终完成生命救援任务。
在爆破场景中,该类任务常见于矿山、井下作业的火药制作等高风险场景,这类任务通常存在抓取与定位偏差,是普遍的行业难题。机器人通过多种高精度传感器和远程遥控可以实现毫米级精准操作,并且大大降低执行该类任务的风险。
蚂蚁数科AI智能终端资深专家梁子表示,具身智能在工业场景有巨大的发展潜力,涵盖制造、质检、产线巡检、物流等重要环节。希望借助此类赛事推动行业聚焦真问题、真场景,蚂蚁数科也将持续开放高质量训练数据与研发平台,与行业共同探索更深入、更丰富的场景应用。
在全球数字经济的浪潮中,与具身智能一同受到行业关注的还有AI行业应用,正逐渐成为新宠儿。无论从用户规模、交互频次及停留时长等维度来看,AI应用热度持续攀升,已到应用爆发的黎明前夕。
蚂蚁旗下的一系列产品,正推动AI应用从“卖工具”进入“卖成果”时代。
在服务类智能体赛道,蚂蚁集团旗下支小宝、蚂小财等系列AI管家产品,正重塑AI产品形态。
在AI+医疗领域,蚂蚁集团旗下AI健康应用“AQ”不仅提供健康科普、就诊咨询、报告解读等上百项AI功能,还连接了全国超5000家医院、近百万医生、近200个名医AI分身等专业医疗服务,适配了鱼跃、三诺等居家慢病管理设备及华为、苹果等健康可穿戴设备,向用户提供一站式医疗健康服务。
AQ的技术引擎蚂蚁医疗大模型,不仅具备“医学思维”推理能力,还具备图片、语音、视频等多模态交互能力。同时,该模型融合蚂蚁的隐私安全风控技术,业内率先通过信通院医疗健康大模型双领域可信评估。在2025世界人工智能大会上,AQ入选“SAIL奖”TOP30榜单。
在蚂蚁百宝箱新产品Tbox超级智能体亮相中,AI应用“成果即服务”的理念已在真实场景中验证。
告别单智能体开发模式下,用户面对的是一个个孤立的AI模型或插件,需要手动串联流程,升级后的蚂蚁百宝箱Tbox把“单兵作战”变成“专家团战”。
现在,用户只需一句自然语言指令,系统即可自动调度搜索助手、PPT设计师、网页工程师等20余位专家智能体,在10分钟内生成一份约15页的可视化报告并同步上线可交互网页。
从Tbox新版本将率先在咨询、教育等行业落地“按成果计费”套餐,客户仅需为最终交付的PPT、报告或网页数量付费,无需理解背后的AI算力、模型去看,Tbox正在把软件商业模式推向第三阶段。
顺着成功导向这一逻辑,蚂蚁集团旗下数字蚂力正式推出首批专家级“AI数字员工团队”,覆盖客服、营销、巡检、销售培训及研发五大核心业务领域,也在为企业提供可量化、确定性的业务增长结果。
其中AI数字客服团队可帮助中小企业提升约70%的人效,降低35%的运营成本,并大幅提高业务转化率。
在数字蚂力的电商客户实践中,这一模式已为企业带来约10%的GMV增长。
数字蚂力推出的是“人机融合”全托管模式,其核心逻辑是,客户购买的不再是复杂的AI功能,而应是包含了技术、专家经验和运营在内的“确定性的业务结果”,进而对整个业务结果兜底。
即AI负责处理大量的标准化工作,实现效率最大化,一旦遇到复杂或边缘问题,数字蚂力的专家网络无缝补位。
此外,蚂蚁数科旗下智能体平台Agentar已覆盖银行、证券、保险等多个金融场景,推出超百个智能体解决方案,核心产品如“金融业务助理”“智能运营助理”“个人金融管家”等,正在重新定义金融机构的人机协作模式。
当AI触角伸向行业应用的深水区,其意义已超越普通的技术范畴。这既是一次技术驱动的产业变革,也是一场关于“科技如何更好服务人类”的探索。在AI可能加剧资源分化的担忧中,以蚂蚁数科为代表的科技企业正在用实践证明,只要锚定普惠目标,技术完全可以成为缩小差距的桥梁,成为科技普惠的关键一环。
【关于科技云报到】
企业级IT领域Top10新媒体。聚焦云计算、人工智能、大模型、网络安全、大数据、区块链等企业级科技领域。原创文章和视频获工信部权威认可,是世界人工智能大会、数博会、国家网安周、可信云大会与全球云计算等大型活动的官方指定传播媒体之一。