一个闯太空,一个爱 “颜值”:机器人的进化超出想象

收录于 前沿科技 持续更新中
当人形机器人赛道陷入烈火烹油的内卷,有两位顶尖科学家选择转身走向少有人走的路:一位扎根天空,要为飞行终端植入通用“具身大脑”;一位聚焦人脸,试图用55%的情感传递,
当人形机器人赛道陷入烈火烹油的内卷,有两位顶尖科学家选择转身走向少有人走的路:一位扎根天空,要为飞行终端植入通用“具身大脑”;一位聚焦人脸,试图用55%的情感传递,跑出实体机器人的Scaling Law。
他们是微分智飞创始人高飞、首形科技创始人胡宇航。前者是浙大长聘副教授、全球前2%顶尖科学家,用名字里的“飞”字锚定毕生热爱;后者是哥大机器人学博士、200万粉丝科普博主,在流量浪潮中精准锚定人机交互的新蓝海。
这一次,五源合伙人孟醒与两位创业者深度对谈,拆解他们背离主流的选择逻辑、科研与商业化的平衡之道,以及对具身智能时代的真实判断。以下是访谈精华重构版。
【嘉宾阵容】 高飞:微分智飞创始人,浙江大学控制学院长聘副教授、博士生导师,2023-2024全球前2%顶尖科学家 胡宇航:首形科技创始人,哥伦比亚大学机器人学博士,短视频账号“U航”创作者(粉丝超200万) 主持人:孟醒,五源合伙人

开篇:为何背离主流?宿命与理性的双重抉择
孟醒:当下机器人行业的讨论焦点几乎都是人形机器人,而你们的方向——飞行具身智能、人脸机器人,既相关又独特。为什么会做出这样“反共识”的选择?
高飞:答案很简单,这是我的宿命。我的名字叫高飞,从小就想当飞行员、开飞机,这个梦想一直没变。浙大本科时,我就开始研究刚兴起的四旋翼;读博、任教期间,也始终扎根单体与群体自主飞行课题。创业前有人劝我做人形机器人,毕竟圈内有知名度,但我没法放弃初心。
更关键的是时代机遇。具身智能让我们有机会用向下结合实体的AI技术,把所有机器人重做一遍——从机械到自动化机器,再到自主机器,最终进化为智能机器。这个机会对飞行机器人同样适用,既是梦想所在,又是时代风口,选择自然清晰。
胡宇航:我是从商业化可行性和技术突破路径倒推的。读博期间我试过足式机器人、机械臂等多个方向,发现所有机器人品类都绕不开一个核心瓶颈:数据。模型参数能无限堆叠,但Scaling Law生效的关键是海量数据,而真实世界的物理交互让数据获取难上加难。
足式机器人只需应对地面交互,还算可控;机械臂要接触液体、柔性织物等未知物体,复杂的物理交互让训练数据极难获取,商业化起步太难。但人脸机器人完全不同,它几乎不需要物理接触,眼神、表情、语言等交互维度,都能通过纯数字信息训练,这和当下大模型的处理模态高度契合,更容易跑通Scaling Law,培育出实体机器人的“GPT时刻”。我的导师一直教我们别做“短平快”的事,要找蓝海,人脸交互就是这样的领域。

深谈:直面质疑——与大疆的差异,及“只有头没有身体”的价值
孟醒:高飞,大家很容易把你和大疆对比,你怎么看待两者的差异?
高飞:首先,现阶段我们还“不配”做大疆的竞争对手。本质上,大疆做的是面向航拍、摄影的影像类飞行器,而我们聚焦“飞行具身脑”,包括大脑、小脑、群脑的一体化基础模型,核心是横向赋能千行百业,而非在具体垂类竞争。
当然,未来若面临竞争也坦然面对。大疆确实是万丈高山,但王阳明说“山高万仞,只登一步”,如果因为山高就害怕,从一开始就放弃了登山的希望。我现在要做的,就是走好眼下这一步,把技术和产品做好,打开属于我们的市场。
孟醒:宇航,我第一次在你的实验室看到人脸机器人时很震撼,但投资初期很多人都困惑:只有头没有身体,能干什么?后来大家又疯狂出主意做IP、游戏、虚拟歌星,你自己是否经历了从“不被理解”到“想象力爆发”的过程?
胡宇航:完全经历过。最开始所有人都质疑商业化前景,直到我们发了一些酷炫视频后,各种合作方向才涌进来。当时老股东提醒我,最大的挑战不是没选项,而是在众多选项中选对。
其实这背后的核心价值的是两点:一是情感传递效率,心理学研究表明,人类交流中55%的情感来自面部表情,人脸机器人能极大解放交互维度;二是IP化潜力,给机器人附上仿生皮肤,就能变成游戏角色、电影人物等各种形态。此前高校有很多相关研究,但缺乏工程化落地,而中国的制造能力和供应链,正好能支撑我们把这件事做成。

实践:商业化路径迭代——学宇树,但不做“教育公司”
孟醒:早期交流时,你们都提到了宇树——先做科研市场积累技术,再拓展商业化场景。半年过去,这个思路有迭代吗?
高飞:创业初期我们确定了技术路线:用大模型实现推理决策,用端到端小脑实现极限飞行,用分布式群脑实现多体协作。但除了“飞得快”,当时没理清具体商业应用,所以想参考宇树做科研教育市场,靠开源模型和基础能力让高校用户帮我们验证场景。
但醒哥当时的提醒很关键:“不要做着做着变成一家教育公司”。现在我很明确,科研教育是阶段、是手段,不是最终目标。我们的核心是保持平台性,借科研市场繁荣生态,但必须向更广阔的产业场景延伸。
胡宇航:我从客户和公司两个维度看这件事。对客户来说,这是精准解决痛点——做AI算法的大多是CS学院的人,让他们搞定硬件非常痛苦。宇树的成功在于,RL兴起时给CS研究员提供了极致的四足机器人本体,让他们能直接进入控制训练。
现在HRI(人机交互)领域的论文,很多因为硬件能力糟糕缺乏标准评估。我们的人脸机器人,模态正好和主流多模态AI匹配,能提供稳定的硬件平台,解决这个问题。对公司来说,这是培养人才的生态——市场上没有“10年人脸机器人经验”的工程师,通过进入高校,让学生用我们的产品发论文,他们毕业时会优先选择我们,形成人才正向循环。

支撑:人才与流量——初创公司的“破局之道”
孟醒:高飞,你不仅要和无人机公司竞争,还要和科技巨头抢强化学习、机器人算法人才,这些人才能力通用,对手钱更多、名气更大,你怎么搞定核心人才?
高飞:核心是两个策略:一是真诚,二是找有共同梦想的人。我曾为了招一个强化学习人才,三趟去上海,虽然最后没成,但这个态度必须有。今年10月校招,西工大和北航的反响比浙大还热烈——这两所学校的学生是因为喜欢飞机才报考的,和我们的“飞行梦”天然契合。
而且这个行业太新了,具身智能领域几乎没有“科班出身”的人,大家都是新手。所以我会降低经验权重,更看重自我迭代能力、独立思考能力,以及愿景契合度。小而精、目标一致的团队,战斗力才最强。
孟醒:宇航,你在读博期间就积累了200万粉丝,对创业公司来说,自媒体传播到底有多大价值?
胡宇航:价值远超预期。首先是降低宣传成本,我们最火的视频播放量超7000万,直接冲上热榜,带来了上下游合作和招聘机会,很多人看了视频主动来求职。其次是重构社交逻辑,以前觉得要多参加社交,但学术界真正同行的人很少,大量社交无效。
自媒体的逻辑是“主动曝光、吸引连接”——对内容和方向认可的人会自然靠近,不认可的会自动离开,不用刻意Pitch别人。抖音这类平台的算法逻辑,还让我们学会了抓前三秒注意力,把前沿技术用大众能理解的方式传递出去,这对培育市场认知也很有帮助。

思辨:资本加持下的克制——不做“动作变形”的创业者
孟醒:你们过去一年的融资速度都远超预期,原本计划的启动资金规模大幅扩容。面对充足资源,如何调整产品节奏和公司战略?会不会因为“能做”就做很多不该做的事?
高飞:融资带来了底气,更带来了挑战——驾驭庞大资源并不容易。以前资源有限,只能精打细算死磕单一场景的PMF;现在有了容错空间,我们加大了基础模型、数据采集、训练设施等基础设施投入,打法更“高举高打”。具身智能赛道发展太快,我们要靠资金优势提升产品普适性,抢占技术身位,覆盖更多场景。
至于避免动作变形,我们有个机制:做大决策时,我会刻意后撤不表态,先让“唱反调”的同事发言,等所有批评意见充分表达后再平衡。这样能中和我的激进想法,保证决策理性。
胡宇航:我们的策略一直是“小步快跑”,融资顺利但没盲目扩张。账上有钱也不会换大办公室、盲目升级设备,每一分钱都要花在刀刃上——要么投入MVP研发,要么攻克核心技术。
而且国内竞争太激烈,我们的内容刚发出去,拍摄手法、配乐都会被复制。充足资金能让我们快速展示技术实力,确立行业引领者位置,吸引更多人才,这是构建战略壁垒的关键,不是用来“挥霍”的。

收尾:具身智能是泡沫还是前夜?
孟醒:最后一个核心问题,两位认为具身智能是泡沫,还是真正的时代前夜?
胡宇航:理想上我不认为是泡沫,但现实中确实有很多未解决的技术难点——数据标准不统一、传感器有瓶颈,甚至实时语音交互、高精度任务控制都没完全搞定。但泡沫退去后会有价值沉淀,我们现在借资本热度攻克核心技术,未来就算泡沫破裂,也能找“沿途下蛋”的落地场景保证现金流。
高飞:我坚定认为这不是泡沫,而是巨大的时代机遇。机器人行业发展几十年,从2000年的机械臂、2010年的扫地机,到2015年的无人机和自动驾驶,虽然都能落地,但离“通用智能机器人”还很远。
具身智能的本质,是给机器加AI,让它从“专用自动化设备”进化为“通用智能Agent”。我们不是在重新发明机器人,而是在重新定义机器人,核心是“通用泛化”,这在技术愿景上完全可落地。对我这种从传统机器人转向AI的人来说,这个机会等了太久,现在的投入和关注度其实还不够。

结语
飞向高空的“大脑”,传递情感的“脸面”,两条看似迥异的路径,背后是相同的创业逻辑:不盲从共识,不畏惧空白。在具身智能的浪潮中,真正的创新者从来不是内卷的追随者,而是定义新赛道的造浪者。


本文来自微信公众号: 五源资本 5Y Capital ,作者:五源

推荐前沿科技

苏公网安备 11011xxxxx号 苏ICP备2025192616号-1