春晚机器人,谁胜谁负?
在马年举办的春晚当中,人形机器人首次以较大规模登上了那舞台,其所留下的堪称经典的场面,着实足够吸引人们的目光:
二十多台机器人在聚光灯下完成大回旋七周半;
按照1:1的比例,仿生机器人对蔡明的面部表情进行了复刻,哪怕是挑眉这样细微的细节,它也能够做到同步呈现。
处于复杂环境里的轮式双臂机器人,能够独立自主地去完成诸如捡玻璃这样的操作,还能够完成像叠衣服这类精细性的操作。
还有的机器人能翻桌跑酷,或是“醉倒”后迅速起身……
图源 / 春晚微博截图
背后热闹亮相的,是四家公司,它们不惜砸下重金,去争夺入场券,展开了激烈较量。松下动力、宇树科技、魔法原子、银河通用,虽都是合作方,然而官方称谓各有讲究:宇树是“春晚机器人合作伙伴”,松延动力是“春晚人形机器人合作伙伴”,魔法原子是“春晚智能机器人战略合作伙伴”,银河通用称作“春晚指定具身大模型机器人”。
名头存在着细微的差别,而这背后所对应的恰恰是四家公司不一样的技术路线以及战略侧重,有人着重强调运动控制方面,有人突出展示仿生交互,有人主要致力于系统集成能力,还有人把赌注押在了具身大模型上。
可是,等到春晚结束,有越来越多的人也着手思考,春晚实质上是一项具备高规格的“演示工程”,它能够进行多次彩排,所追求的是那种唯有一次的完美演出,舞台上获得成功并不等同于场景在实际中得以落实。在这场耗费资金数目不低且曝光度极高存在风险的行动里,获取流量基本上是已确定的事情,然而机器人从“春晚舞台”迈向“千家万户”,距离究竟还有多么遥远呢?
扎堆上春晚,四家机器人表现如何?
宇树科技、银河通用、松延动力、魔法原子,于2026年马年春晚的舞台上,以武术、仿生、对话以及精细操作等多样形式集体闪亮登场,这般密集且具备高水准的呈现,使得观众不由得发出关于人形机器人迭代速度的感慨,仅仅历经一年时间,它们就从那种需要被搀扶才能上台的略显青涩的表现,发展到能够自主玩梗、实现连续空翻的全新状态了。
松延动力,首次于最先开播首个节目名为 《奶奶的最爱》这个小品类节目里登上舞台,旗下拥有的机器人N2、E1以及小布米各大型号,统统都被搬到了台上,展示出了走路跑步、讲冷笑话玩梗等各种各样的技能,其中小布米走路的姿势十分接近于人类,而N2更是能够轻松地完成垫步侧手翻这一动作,拟人化的动作以及人机交互这些方面非常引人注目。
图源 / 春晚微博截图
但更有话题性的,是其所研发的蔡明同款仿生机器人,该机器人依照1:1的比例真实刻画蔡明的外形,更值得一提的是“脸上”隐匿着32组微型马达,能够精确地模拟蔡明挑眉和皱眉等细微表情以精准模仿,就连脖子转动都和呼吸的节奏相契合,整体显现出接近真人的状态,这同样意味着人形机器人在“面部模仿”这条赛道上,又朝着前方迈进了一步。
最多“戏份”的是魔法原子,在主会场上,易烊千玺、言承旭等艺人与六台人形机器人 Z1 和两台 Gen1 一同登台演绎《智造未来》,在宜宾分会场里,上百台呈“大熊猫”造型的四足机器人完成了大型群控表演。
与此同时,存在实用性方面的展示,其中,Gen1摇身一变成为“捞面师”,完成了起面的动作,接着又有控水的举动,随后进行倒面等一系列连贯的操作,并且还为老人斟酒;另外,Z1以“送餐员”的身份展开相关行动,将宜宾燃面送到了指定的那一个位置。
整场晚会,魔法原子机器人的综合实力得以充分展现,它们能够完成大型编队表演,表演时整齐度令人惊叹,它们还可以执行捞面、斟酒这类生活化操作,并且能够灵活适应舞台、餐厅等多种场景,进而实现与人和环境自然且顺畅的互动。
拥有标准动作的宇树科技是一名选手,其动作类型为动作型,在武术节目《武BOT》里,该科技的机器人完成了一系列高难度动作,这些动作包含连续翻桌跑酷、弹射空翻等,且在全球首次达成了一项壮举,即把大回旋完成了七周半,完成的动作流畅又稳定,因此被称赞为“超越真人”。
值得予以关注的,还有群体协同这一方面,舞台之上,二十多台机器人达成了高速奔跑期间的实时变阵,以及协同武术,它们的动态协调能力,相较于去年仅仅能够慢速转手绢以调整队形而言,已然有了质的飞跃。
人机互动环节里,加装一双灵活的“机械手”后,它能稳稳接住长棍并旋转,剧情安排下,它完成“醉倒”后迅速起身的鲤鱼打挺动作。这些设计增添了表演趣味性,直观展现了机器人失去平衡时快速自我调整的能力,让人看到它朝着更实用、更智能方向迈进。
同宇树着重趋向极限运动之性能存在差异,银河通用于其贺岁微电影《我最难忘的今宵》里,着重展现了机器人在认知以及操作层面的“大小脑”能力。
那轮式双臂的机器人G1,展现出好些贴近生活的技能,像是盘核桃,捡玻璃碎片,叠衣服,从货架取物,还有简单烹饪,其动作流畅又自然。
更为关键的是,按照官方所讲,它并非全然依照预先编好的程序逐一步骤去执行。而是有着自行观察周边情况,进行思考判断的能力。此后再去完成整个任务。这表明它在杂乱无章的真实环境当中,也能够独立展开应对举措,做出精细化的操作。在和演员沈腾、马丽的互动期间,它的反应相对较为自然,能够及时察觉到周围出现的变化并给出回应。
整体而言,2026年春晚宛如国产机器人领域的一回集中答题,对于松延动力的仿生情感交互来说,魔法原子具备多场景实用能力,宇树科技进行极限运动以及集群协同这个方面,还有银河通用的自主决策与精细操作,这使得人们瞧见机器人技术凭借不同途径,正致力于探索怎样能更深入地为现实生活服务。
表演背后,谁更技高一筹?
伴随春晚落幕的是精彩的机器人表演,随之而来的是一个更值得深思的问题,让机器人完成一段预设舞蹈,让机器人进行一场即兴对话,让机器人完成一项精细的实体操作,其背后的技术挑战与实现路径究竟有何不同,谁的技术门槛更高?
有一点与大众直观感受存在明显不同,那就是,从技术达成角度而言,使机器人能够有着“自然对话、即兴玩梗、捞面、倒酒”这些能力,其所含的价值并不必然会比表演“具备视觉震撼力的预先设定好的舞蹈动作”要低。
将多位从业者所讲的内容综合起来看,机器人进行表演时,其技术难度能够划分成四个不同的等级。
位于第一层的是入门级,对身为北京大学计算机学院访问工程师、且在机器人领域有着丰富实践经验的情况做进一步阐释,入门级与过去50年里机器人一贯从事的传统工作相类似,依照顺序去执行动作、找寻到自身所应处的位置,诸如此类的技术已然是成熟的了,当下室内展开定位时甚至能够精准到位至厘米的级别。
第二层属于进阶级,在多模态大模型兴起以后,让机器人开始具备变得现实的能力,这种能力集中展现于对话方面。
资深从事具身智能的人员Kris告知「定焦One」,机器人具备对话以及玩梗的能力,这主要是依靠大模型能力取得了进步,跟豆包相类似的这类应用已经步入C端普及的阶段,在当前阶段达成这类功能,难度并不是很大,然而目前存在的瓶颈是泛化能力欠缺,也就是当面对超出训练场景的突发状况的时候,机器人通常很难灵活地进行应对。
所以有从事相关行业的人指出,松延动力机器人在小品里所呈现的带有玩噱意味的对话,极有可能是预先设定好的脚本同实时交互技术相互融合的结果。一方面,鉴于春晚舞台具备的复杂特性以及对于表演稳定性所作出的极为严格的要求,故而像关键台词、互动流程等核心部分大概率是经过了事先编排的,另一方面,凭借大模型所拥有的实时推理能力,机器人在一定程度上也能够依据现场演员的即兴发挥给出动态的回应。
第三层属于挑战级,其难度在舞蹈动作方面有所体现,不过与初级不一样,它是类似连续空翻这种对软硬件综合能力有着更高要求的动作,宇树科技在此次表演里呈现的连续多次后空翻便是这类,Kris称,当前市面上达标的机器人数量不多,很多产品在运行时依旧容易出现“趴窝”状况。
针对最高层级的顶级那种难到极致的程度,是聚焦于人机深度交互之上的,这一情况需要机器人不但能够对环境有所感知,而且除此之外还要理解人的意愿想法,进而做出安全且恰当合适的反应。
例如,松延动力旗下的机器人,具备识别蔡明微表情并同步的能力,进而完成情感层面交互;银河通用的G1,可精准定位且拾取细碎玻璃片,展现出对物理世界的精细操作能力;宇树科技于《武BOT》里设计的“醉倒”后鲤鱼打挺桥段,表面呈现的是戏剧效果,实际上演示了机器人在失控状况下迅速恢复平衡、防止碰撞人类的安全兜底能力。“当前在人机交互当中,能够做到共舞协调不踩脚已然极为困难了。”如此表述。
然而,在当前这个阶段,人形机器人要真正做到“读懂”其周边的环境,并且能够与真人配合得流畅自然,这之间还存在着相当大的差距。
所要留意的是,于评判这些技术演示的实际水准之际,另外一个常常被忽略然而极为关键的维度乃是达成场景的可靠性。举例而言,机器人能不能在不可逆转的现场直播里稳定地展现,这是对技术成熟程度的严格要求。一回成功的演示,并非等同于能够长期进行复现的能力。
在本次春晚里,银河通用选用以微电影的形式来展现其机器人的自主操作能力,这于一定程度上避开了直播对系统实时性以及稳定性的那种极端挑战,还使得观众能够看到,是在经过多次尝试以后才挑选出来的“最优表现”。这么一种呈现方式本身,在一定程度上也体现出当下技术从实验室、受控场景迈向真正复杂现实环境之际,所普遍遭遇的门槛。
总之,本次春晚当中,各大机器人公司展示出了各异的拿手本事,有的专门钻研极致控制,有的去挑战智能交互,有的致力于复杂环境适应,这体现出了行业不一样的技术路径以及积累。在从业者眼中,不管呈现形式是直播或者录播,这些机器人能够依照预设动作顺利完成表演,已然达到了他们对于行业现阶段能力的合理期望。
春晚之后,离实用还有多远?
另一大受市场关注的焦点是,机器人离开春晚这个精心打造的舞台后,能不能在现实世界里稳定开展工作。毕竟春晚更像是一场“演示”,侧重于单次表现的确定性与观赏性,不能完全等同于复杂场景下的实际落地能力。
有不止一位从业者指出,对于「定焦One」而言,机器人在春晚上所进行的舞蹈、翻跟头等表演,是不能直接就等同于它在复杂环境之下的真实作业能力的,然而其已经是十分地接近真实工业以及生活场景对运动控制提出的要求了,所以这一部分的“底盘能力”已然是相对成熟的。
解释,春晚的环境对机器人而言,其复杂程度并不亚于工业场景。
现场灯光出现复杂的变化情形,这对于计算机视觉而言存在极大的干扰状况 ,电磁干扰虽然不一定能够达到工厂的那种级别状况,可是其所造成的影响也是相当显著突出类型的 ,存在能够对运用上的机器人相应涉及到的通信以及定位产生影响作用 ,“因此” ,在当前此时此刻所针对的非常之复杂情形方面的环境下方还仍旧能够确保稳定地完成动作一系列情况 ,表明其硬件的可靠性以及基础控制方面的算法已然形成到属于较为成熟稳定的地步。
他拿翻跟头这个舞蹈动作来举例,这类动作所反映的,是机器人在复杂环境里降低失误的能力,以及出色的平衡控制,这就等同于为未来机器人能够进入养老等场景,去执行协助老人翻身、更衣等对平衡能力有着高要求的任务,做出了技术方面的保障。
要留意的事情是,哪怕春晚上机器人的呈现值得予以肯定,然而距离真正实现应用还有相当长的一段路程要去走,前面提到的那个(翻跟头等舞蹈能力)是后面所说的那个(落地服务能力)的必要但并非充分的条件。他着重指出,机器人还得拥有更为复杂的“感知–认知–行动”的闭环以及长期自主运行的能力。
把从业者的观点综合起来看,人形机器人若要实实在在地走进生活场景以及生产场景,起码还会面临四个方面的挑战。
首先是泛化能力,要具有举一反三的灵活性。
即便春晚里的机器人,各个动作都历经反复彩排精确至毫秒,然而真实场景却满是不确定性,当你对家用机器人讲“把房间收拾一下”,它面对的可不是单一指令,而是个带有开放性的命题包括这个家庭整洁的标准究竟怎样到底如何判定散落的书放回书架是合适还是放在桌角更恰当脏衣服是放进洗衣篮还是直接启动洗衣机机器人得凭借对物品用途空间关系以及家庭习惯的理解自行拆解任务依照动态情况做出决策并非简单调用预设程序。
图源 / 春晚微博截图
其次是持续的自主性。
春晚的表演,一般是在几分钟内进行高强度输出,机器人届时会在聚光灯下,将算力与能量耗尽,在完成完美展示之后,便可关机进行检修。然而,在家庭或者工业场景当中,所需要的是7×24小时乘以365天这样的连续运行,这便要求机器人要具备较强的自主性,这其中涵盖能耗的动态平衡、故障的实时自诊断、关键部件的预测性维护,甚至在极端情形下,能够自主做出决策,究竟是暂停任务还是继续执行。
第三是真实的情境理解与交互。
春晚舞台之上呈现的“情感表达”,究其本质而言,乃是预设好的表情包以及动作库存,像微笑、眨眼、挥手这般,然而若要把它落实到家庭现场之中,那么机器人必须拥有自身的情感算计能力,比如说能够辨识出老人细微表情背后所隐藏的孤独或者是焦虑之感,又或者在重复进行对话之时稳稳保持住耐心,这种依靠长期陪伴为之构筑信任关联、甚至是给予心理支撑的能力,是没办法调用已经预设好的脚本的。
Kris做了总结,当下最为根本的技术限制存在于,大模型依旧处在对模式的模仿以及概率计算的阶段,并非是真正地理解世界并且形成常识认识。怎样去让机器人拥有近似人类的理解与判断能力,而不单单是执行预设或者统计意义方面最具可能性的回应,是其“大脑”进化进程里最为艰巨的课题。还觉得,想要让机器人承担更多有意义的工作,当前的核心是持续提高其“大脑”能力,涵盖环境理解、危险预判、复杂动作规划等层面。
最后,成本同样是一道关键难题,尽管机器人已然开始步入量产阶段,然而却依旧价格高昂,当下人形机器人单机成本通常超过10万,春晚定制产品更是“不考量成本”,所以很难被复制至商业化场景里,对于企业客户来讲,高额的采购成本与不确定的回报构成了鲜明的反差,直接对机器人行业的落地速度起到了制约作用。
此次春晚所给予的“官方认可”,的确使得机器人行业的热度得以提升,其曝光程度大幅增加。然而,在这热闹的背后,“在表演方面较为突出、在实际应用方面有所欠缺”依旧是该行业存在的难题,尽管机器人技术更新换代的速度相当快,可是从展示技艺到真正融入日常的生活当中,仍旧存在颇为漫长的一段路程需要去走。
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权本站发表,未经许可,不得转载。
