人形机器人:考验中国“硬科技”

发布时间:2024-12-05 18:06:42 来源: sp20241205

  作者:李明子

  发于2024.3.4总第1130期《中国新闻周刊》杂志

  在合肥蔚来汽车工厂,来自深圳企业优必选的工业版人形机器人Walker S正在接受“实训”。身高1.7米的机械“员工”在检查完车门锁、安全带和车灯盖板后,走到车头前,极为轻柔地给新车贴上车标。

  在大洋彼岸的美国,就在不久前,美国初创公司Figure刚把第一款人形机器人Figure 01送入宝马的斯巴坦堡汽车工厂打工,替代人类从事一些危险度高的工作。

  随着人工智能的突破性进展,作为最佳载体的人形机器人将不再是只能送餐、拧螺丝的“工具人”。大模型将赋能人形机器人走向主动交互,使其成为继计算机、智能手机、新能源汽车后的颠覆性产品。人形机器人每迈出一步,都能掀起市场热潮,人形机器人的商业化步伐也在竞争中不断加快。

  中国也是这一波热潮中最积极的冲浪者之一。2023年10月20日,工信部印发《人形机器人创新发展指导意见》(以下简称《意见》),指出人形机器人集成人工智能、高端制造、新材料等先进技术,将深刻变革人类生产生活方式,重塑全球产业发展格局。

  当前,人形机器人技术加速演进,已成为科技竞争的新高地和经济发展的新引擎。又一场举国竞赛,已经打响。工信部前述《意见》提出,到2025年,我国人形机器人创新体系初步建立;到2027年,人形机器人技术创新能力显著提升,综合实力达到世界先进水平。

    飞速进化

  在去年夏天的2023世界人工智能大会上,以康复机器人为拳头产品的上海傅利叶智能科技有限公司发布了首款通用人形机器人。然而,一些人工智能公司已经等不及最终版产品,傅利叶智能通用机器人事业部总裁周斌曾对媒体透露,“研发过程中就陆续有公司买走人形机器人去验证他们的AI算法了”。

  人形机器人产业因大模型的出现而升温。GhatGPT的横空出世点燃了全球范围的“百模大战”,而具身智能被认为是“人工智能发展的下一个浪潮”,一个能理解、推理并与物理世界互动的智能系统需要一具“肉身”,人形机器人无疑是最佳载体。

  “引入人工智能大模型,相当于给人形机器人装上了智慧大脑。”北京新鼎荣盛资本管理有限公司董事长、创始合伙人张弛告诉《中国新闻周刊》。AI的发展让市场看到了人形机器人落地的可能,人形机器人能理解并执行指令,完成真实工作,而不再是只能跳舞、展示的吉祥物。

  不同于传统工业机器人只为完成特定任务而存在,人形机器人自诞生便背负起了智能化期待——像人一样感受世界、作出决策并执行任务。1973年,日本早稻田大学推出了世界上第一台全尺寸仿人机器人WABOT-1,它能够用日语与人交流,测量方向与距离,缓慢行走并抓取物体,相当于一岁半儿童的智力。

  “日本擅长机器人的物理特性开发,而美国擅长机器人思维开发。”如卡内基梅隆大学计算机科学学院教授马夏尔·赫伯特所总结,美国在人工智能领域领先。计算机科学和机械工程的跨学科合作让美国公司逐渐取代日本成为机器人领域的领军者,一个标志性事件是,2011年日本福岛核电站因地震和海啸发生核泄漏事故后,参与事故处理工作的机器人来自美国公司iRobot。

  人形机器人要实现与物理世界交互,就要具备感知和理解能力,这些更离不开AI的发展。“如果说深度学习让人工智能对世界有了感知,当下爆火的大模型则让人工智能有了自主生成的决策能力。”张弛举例说,AI大模型的出现,让人形机器人拥有了更强大的工具链,理论上,只要让机器人学习足够多的数据,就能拥有类人智能,从而脱离预设规划,进行自主决策。与此同时,“多模态”能力的建立可以让机器人多线程处理信息,实现感知-决策-执行的全流程。“AI赋予了这轮人形机器人热潮的想象空间,即走向通用。”

  事实上,安装智能大脑后的人形机器人正在飞速进化。谷歌实验室中,基于“视觉-语言-动作”模型“RT-2”的机器人已经能完成“捡起灭绝动物”的指令,在放着恐龙、鲸鱼、狮子三个塑料玩具的桌面上,机器人准确拿起了恐龙。由此推算,只要有足够的数据、算法和算力,机器人将能胜任更多复杂场景。今年1月4日深夜,谷歌DeepMind连发三项新进展,均基于RT-2模型,用于提升机器人的速度、数据收集以及泛化能力。

  就在当天更早些时候,来自斯坦福大学的三人团队放出了基于Mobile ALOHA系统的机器人演示视频,烹饪、清洁桌面、按电梯,训练后的机器人可以完成复杂的移动操控任务。而在美国初创公司Figure发布的演示视频中,机器人Figure 01仅用10个小时,就能通过观察学会煮咖啡。2024年开始的第一个月,斯坦福、谷歌、Figure、特斯拉接连发布至少6项有关人形机器人的新进展。

  “从学术界到产业界,这波人形机器人热度很大程度上是被特斯拉带动起来的。”优必选董事会主席、执行董事兼行政总裁周剑对《中国新闻周刊》说,2022年,特斯拉把人形机器人擎天柱的原型机搬出来展示后,国内产业界很快有所响应,甚至有厂商董事长上门寻求合作。

  到去年底,特斯拉发布的擎天柱第二代演示视频中,拥有触觉传感器和11个自由度的灵巧手已经能用双指将鸡蛋轻拿轻放,似乎可以完成更多“精细”任务,如装配、柔性物体操作等。擎天柱最近一次露面则是在埃隆·马斯克的社交媒体上,展示视频中的机器人正从容地叠着衣服。按照马斯克曾经的设想,机器人的功能将不断更新,未来三至五年,将会推出可供大众消费者购买的版本。

  长久以来,人形机器人难以商业化的最大制约就是高成本,不论是曾由美国国防部资助的波士顿动力Atlas,还是已经停产的本田ASIMO,造价均高达上百万美元。“特斯拉给人形机器人提供了明确的落地场景,更为关键的是,马斯克表示要将造价降到两万美元左右。”周剑说,这让产业界看到了大规模量产和商业化的可能,“人形机器人已经走到了产业化前夕”。

  这也让很多中国创业者跃跃欲试。

    第一批“先行者”

  对周剑来说,二次创业选择人形机器人的难度远超最初设想。

  2008年,周剑在日本一场展会上被小巧灵动的人形机器人吸引,看着高达几万元人民币的售价,他萌生了“研发普通家庭能买得起的人形机器人”的想法。

  当时,工业机器人因制造业发展而得到广泛关注,面向大众消费者的服务机器人产业环境却还十分匮乏。让机器人手脚动起来的秘诀是“伺服驱动器”,也就是机器人的“关节”,那时只能从韩国、日本、瑞士进口,一个关节动辄上百美元,而制造一个机器人需要十几个关节。产品如果想实现量产和商业化,必须自主研发,突破国外技术壁垒。

  “最大的难关在于没有经验可循。”周剑回忆,创业初期,研发团队买了各国机器人回来拆装实训,每个环节都要经历无数次试错与改进。

  周剑手上全部流动资金2000多万元很快烧完,就像扔进无底洞。当时人形机器人是冷门行业,不被风投看好,缺少市场资金支持,周剑就自己给自己“输血”,投入了第一次创业的全部积蓄,卖房卖车补贴研发,最窘迫时甚至借钱发工资。

  与伺服驱动器的研发死磕五年,最终自研“关节”不但在质量上媲美海外一线产品,获得多项专利,成本价也降到了进口零部件的几十分之一。核心零部件“卡脖子”问题得以解决,为优必选机器人后续商业化奠定了基础。2014年,优必选的第一款小型人形机器人Alpha成功量产,售价从几万元降到了几千元。

  为提高研发生产效率,周剑选择在深圳创立公司。珠三角地区的产品供应配套更完善,更容易找到符合生产要求的工厂。周剑曾粗略计算过,企业落户深圳后,各项零件生产效率提升至少50%,费用也能节省30%。一次路演过程中,优必选被比亚迪联合创始人、正轩投资创始人夏佐全看中,获得了天使轮融资,顺利解决了公司资金难题。“我想我们能成功获得投资,从某种意义上来说,是市场相信深圳的企业和产业基础。”周剑说。

  在周剑看来,国内完备的工业制造体系和产业链为人形机器人量产提供了保障。人形机器人可与工业机器人、新能源汽车等产业共享许多相似供应链,如电池、芯片、传感器、控制器等,可以实现供应链的协同迁移。

  首款小型机器人顺利量产后,周剑把目光投向了更具挑战性的大型人形机器人研发。和常规认识相反,让机器人用两腿走路比用“脑”思考更难,至今仍是世界难题。

  当时,国内科研所不乏人形机器人项目,进度却相对缓慢。北京钢铁侠科技有限公司创始人兼CEO张锐曾在北航无人机所、中科院自动化所、航天五院工作。他坦言,机构团队中所学专业过于接近,思维方式不够开阔,并且容易受到计划变动等影响。考虑到最终成果考察的压力,一些技术尚不成熟的前沿研发项目不易得到相应资源支持。

  大型人形机器人的风头始终被海外公司和研究机构占据。美国波士顿动力、日本本田、意大利RobotCub Consortium等公司都在“人形机器人”项目上不遗余力地砸钱。相比之下,国内研发起步较晚,且主要以项目研究为导向。直到2000年,国防科技大学才研制出国内第一台仿人机器人“先行者”,到2015年北京钢铁侠科技成立,国内“双足大仿人机器人”逐渐走出实验室,试水商业。

  “最大的研发困难就是机器人在行走状态下随时都可能跌倒。”张锐解释,核心技术难点在于步态控制、环境感知等环节构成的机器人运动脑。让机器像人一样在行走过程中达到一种动态平衡,就要根据机器人的不同状态单独设计算法,最核心的一步是对机器人进行数学建模分析,依此计算出机械结构,再根据预设的重量、自由度等指标,分析计算出每个关节的力矩、转速。

  而让机器人从图纸走到现实,还需要工程师和工厂反复磨合、拼装测试。在周剑看来,国内在人形机器人算法研究和开发方面与国际先进水平存在差距,一些高端传感器还相对薄弱,但国内核心零部件供应链中,伺服电机、控制系统及减速器等部分零部件已经具备一定国际竞争力。“核心零部件实现国产化只是时间问题。”

  前述工信部的《意见》也提出,到2025 年,“大脑、小脑、肢体”等一批关键技术取得突破,确保核心部组件安全有效供给。

  在政策鼓励下,2023年11月初,北京成立了首家省级人形机器人创新中心,拟开展通用人形机器人本体原型、人形机器人通用大模型等5大重点任务攻关,法定代表人由优必选首席技术官熊友军担任,采用针对卡脖子问题“联合攻关”的模式。

  “中心集合了中国人形机器人上下游制造链的重要单位,未来将共同攻克卡脖子技术,包括核心零部件、运动控制等各环节的难点,推动产业化落地。”周剑说。

    商业化的“苦行”

  2023年最后一个交易日上午,创业16年的周剑领着11岁的优必选在港交所敲锣上市,陪在他身边的是公司最新研发的用于工业领域的人形机器人Walker S。到上市前,优必选售出超76万台机器人。其中,真正接近“具身智能”概念的人形机器人产品——Walker系列,两年半内仅卖出了10台。

  “问题是现在的人形机器人还不够智能,即便是在最被看好的汽车产线这一场景中,也还无法替代既有工业机器人,更无法替代人,企业不会为‘大玩具’买单。”张弛指出,大型工厂基本被国际工业机器人四大巨头垄断,德国库卡在汽车行业拥有奔驰、宝马等核心客户,瑞士ABB的运动控制核心技术优势突出,日本发那科、安川在汽车制造业和电子电气行业布局广泛。

  与其进工厂打工,家庭养老陪伴被认为是人形机器人最理想的落地场景。“但这是产业发展的长期目标。”张锐说,和落地工业面临的问题一样,“机器人保姆”因智能度和价格原因也无法马上量产,真正市场化还要解决客户认可度、销售渠道、法律法规、伦理等系统问题。

  “现在大家看到的打招呼、简单抓取等功能,在2017年第三代人形机器人身上基本都能实现。”张锐介绍,如今钢铁侠的人形机器人已经升级到第五代,并在2021年中标国家首个机器人宇航员项目。某种程度上,这实现了张锐创业的初衷。

  此前十年,美国和俄罗斯已相继把人形机器人送入太空,在空间站执行科研、维修等任务。人类长期在太空失重环境下会出现肌肉萎缩,机器人终将成为航天科技发展史上的重要一环。张锐在2015年提议研发宇航员机器人,但当时没有相关项目立项和经费,这才决心出走创业。

  “并不是所有工作和环境都一定需要人形机器人。”张锐也认可,机器弥补劳动力不足是必然趋势,甚至在一些场景终将替代人,但目前市场需求并不显著,有明确需求的主要是高校科研、航空航天和军事等个别领域。

  机器人的商业化探索,走过漫长的弯路。在这波由大模型和马斯克带动的产业热潮之前,国内机器人行业已经经历了两次创业高峰。最早一批本土机器人公司在上世纪90年代前后成立,最后大多演变为机器人集成商或代理,自主创新者少,即便后来有公司上市,市值规模也鲜少超过50亿元。2015年后,对标国际“工业4.0战略”,受国内利好政策鼓励,涌现了大批工业机器人公司,只有少数坚持至今。“跟风创业很难做长久,企业最终还是要解决实际问题,创造新产品。”张锐说。

  声名在外的ASIMO被本田定义为最高技术代表,最终也因对公司实际价值有限而在2018年被解散。张锐曾专程到日本拜访过本田ASIMO团队,人员已经被分散到了其他部门,从而把研发人形机器人积累的技术复用到其他产品上,因为这更符合一家商业公司的发展逻辑。

  张锐选择了和本田ASIMO相近的做法。在钢铁侠科技完成前三代机器人研发,准备进入商业化时,张锐对公司进行了成立以来规模最大的一次组织架构调整,将初期按技术分工搭建起来的研发团队,根据项目需求,动态抽调到不同商业化项目中。

  “人形机器人是钢铁侠科技的技术源头,但我们从不把它作为唯一产品,真正带来稳定现金回报的是能满足客户需要的更实用的产品。”张锐举例,如应用于山地运输的无人驾驶车辆、可在管道内执行开采任务的机器人、面向智慧工厂的搬运机器人等产品,“目前只做企业订单,不面向大众消费者”。

  人形机器人做出来,究竟卖给谁?“人形机器人产业缺少有效客户,需要国家引导几个大产业优先使用人形机器人。”张锐认为,需求端对产业发展的倒逼效果往往事半功倍。

  特斯拉的擎天柱被认为是最接近商业化的产品,这得益于“前置产业”自动驾驶的技术积累。通过汽车研发,特斯拉完成了从云端到终端的全部核心软硬件的自研,已经造出了“带轮子的机器人”。即便如此,马斯克也在2023年表示,没想到人形机器人上每一个部件都需要重新研发,不得不令人对人形机器人产业保持冷静。

  据张弛观察,在人形机器人这条赛道上,国内软硬件技术仍在快速发展,但目前产品不成熟,技术路线还没走通,谈补贴还为时尚早。“产业真正要思考的是,能为人形机器人买单的客户到底是谁?”

    考验的是“国家投入”

  当科技爱好者惊叹擎天柱熟练操作家务时,马斯克很快在社交平台发布了一条“免责声明”。他提示,擎天柱目前尚不能自主执行叠衣服操作,但将来肯定能够在任意环境中完全自主行动。

  换句话说,在完成一些复杂动作时,机器人背后可能正有一个远程操控的人,就像被训练的游戏角色一样。Mobile ALOHA项目团队就曾出面解释过,对抓取、摆放物体等简单动作,Mobile ALOHA 机器人可以在 50 次学习之后达到 90% 的成功率,而对一些复杂任务,如装盘、打蛋,它依旧需要人类干预。

  “应该将 Mobile ALOHA 看作一辆制造精良的跑车,而它仍需要人类驾驶才能表现出自己的能力。”英伟达高级科学家Jim Fan发文评价。现阶段的机器人还无法完全自主,“学习”过程也如孩童一般,花式翻车才是常态,就像Mobile ALOHA项目负责人的吐槽,“机器人还没准备好接管世界” 。

  在无所不能的仿真世界和处处掣肘的现实中间,还有一道由基础材料科学筑起的壁垒。“大模型目前还无法给人形机器人产业带来颠覆性改变,除非能跨越软硬件之间的鸿沟,实现数学模型和物理模型的统一。”张锐说。

  “短期内人形机器人大规模产业化的条件还不成熟,需要做好长期投入的全方位准备。”张锐直言,目前人类已掌握的人形机器人技术与人体结构组成相比都很落后。随着技术的发展,现在已经用过的和即将使用的人形机器人技术,都很可能会被淘汰。“长期稳定的研发投入,也需要国家、地方政府和全社会各界的支持。”

  自去年 8月27日以来,监管部门持续收紧IPO,市场上一直有传闻,“亏损企业不得上市,科创板第五套上市标准暂停”。不过,硬科技公司仍可能被“开绿灯”。据21世纪经济报道,具备硬科技属性、营业收入增长的亏损企业仍可继续推进科创板上市进程,前提是市场前景明朗、技术行业领先、收入有所增长、因科研投入大而导致利润下降或亏损,且亏损程度不高,这样的企业并不多。

  “投资人的退出前景不乐观,自然不敢轻易投资科技。”张弛说,基金投资周期一般3至5年,这对还处于实验室阶段的产业来说时间太短,来不及产业化落地,企业上市之路艰难。而风投资金没有稳定的退出渠道,最终只能追一些盈利快、市场确定的行业,不敢投早投小投科技,如此一来,科技项目因缺少资金而发展缓慢,又将陷入新一轮恶性循环。“说到底,要支持科技创新和产业进步,就必须解决资金的资本化问题。”

  风投资金对人形机器人的兴趣,也开始出现了新的风向。人工智能研究室OpenAI也将真金白银投向了人形机器人。挪威的人形机器人初创企业1X Technologies在2023年3月获得了OpenAI创业基金领投的A2轮融资,金额达到2350万美元。银河证券研报则指出,2024年有望成为人形机器人量产元年。

  继工信部印发《人形机器人创新发展指导意见》后,北京、深圳、上海先后发布产业支持政策。北京设立了100亿元规模的机器人产业基金,上海计划打造具有全球影响力的人形机器人产业高地,建设“大模型+人形机器人”协同创新平台,深圳则是借助《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023—2024年)》,提出发挥粤港澳大湾区制造业优势,开展人形机器人规模化应用。

  工业和信息化部副部长徐晓兰曾强调,下一步工信部将坚持顶层设计,通过指导产业创新发展、整机带动、软硬协同和生态构建,来推动中国人形机器人技术和产业的高水平发展。

  在人口增长放缓、老龄化比例上升的当下,机器人帮助人解决关键问题的发展趋势已然不可阻挡。有声音甚至预测,在未来某个时刻,机器人与人类的比例可能超过1:1,机器人的数量将超过人类。“人形机器人的商业化需要场景、技术和资本的共同催化,此刻的人类世界或许正处于深远的变革期之中。”周剑说。

  《中国新闻周刊》2024年第8期

  声明:刊用《中国新闻周刊》稿件务经书面授权 【编辑:刘阳禾】