EP03 Generalist、π 和 Sunday:通用具身落地的技术趋势与挑战
1|📒The Alphaist 播客栏目介绍 《The Alphaist》 是一档由Alphaist Partners打造的深度对话栏目。 我们关注技术与创业的第一性原理,聚焦那些正在改变世界的早期创始人、工程师与产品探索者。 每期节目,我们会围绕一个具体的科技创业方向展开深度对话。在这里,我们不追热点、不讲空洞概念,而是用最真实的一线经验去回答创业者最关心的问题:什么值得做?为什么是现在?我们应该怎样做? The Alphaist 相信:时代真正的机会,往往藏在那些不喧嚣、但正在被新技术、新需求、新产品悄然改变的新生领域。 我们希望用这档节目,陪伴新一代的 Alpha 创业者们,记录与见证那些改变世界的勇敢开始。 📢 我们建了一个 The Alphaist 行业交流群,希望聚集同频的一线工程师、研究者与创业者,在这里分享行业进展、一手消息,以及任何还没琢磨透的问题。为保持良好的社群氛围,入群需经过审核,点击链接填写申请问卷:https://alphaist.feishu.cn/share/base/form/shrcn8vew7eoXd6Vk8VPjrIXJAN 2|🤖本期播客介绍 2024年11月,三家硅谷公司几乎同时投下重磅炸弹:Generalist AI 宣称找到了机器人领域的 Scaling Law,Physical Intelligence 发布了能从错误中学习的 π0.6,Sunday Robotics 用一只200美元的手套重新定义数据采集。 这不是巧合,而是一个信号——具身智能可能正在逼近它的"ChatGPT时刻"。 但真相远比Demo复杂:27万小时数据够不够?机器人真的会涌现吗?为什么"端到端"让工程师又爱又恨?当硅谷还在Research Lab模式里探索时,中国公司已在问"三年内能做什么产品"——谁会笑到最后? 本期嘉宾: * 冯思远:Toyota Research Institute 研究员,Diffusion Policy 联合作者 * 俞冠廷 (Peter Yu):XYZ Robotics CTO * 张强 (Jony):国地共建具身智能机器人创新中心首席研究员 我们将深入讨论: * Scaling 的信仰:Generalist 声称找到 Scaling Law,但怎样定义Scaling Law? * 从模仿到经验:Physical Intelligence 为什么让机器人"从错误中学习"? * 数据革命:Sunday 的三指手套能否打破数据采集瓶颈? * Evaluation 困境:没有公认的 Benchmark,我们怎么知道在爬“正确”的山? * 形态之争:为什么三家最前沿的公司都选择了"非人形"? * 中美路径:Research Lab vs 产品导向,哪种模式更适合探索期? 3|🕙时间轴 研究范式转变 * 05:12 范式转向:Diffusion Policy让监督学习"又可以了",完美接上LLM趋势 * 07:53 工程务实:Right tool for the right job,VLA每次evaluate都很expensive * 08:28 端到端代价:模块化可以写Spec做Unit Test,VLA只能说"大概能跑" * 10:34 意外的跨界:π0.6出来后,来讨论的反而是自动驾驶的人——他们每天能用的数据不到1% Generalist:Scaling的信仰 * 12:04 Bet against Scaling Law,基本上不是一个好主意 * 12:58 Evaluation困境:没人知道task长什么样,没人能复现任何实验 * 15:18 数据质量的隐忧:两只手夹爪做daily life,但工业场景用吸盘吸箱子——这很难transfer * 17:07 Harmonic Reasoning:可能是observation和action同步predict,不是新想法,但工程实现很难 Physical Intelligence:从错误中学习 * 21:21 路径转变:采了很多数据后发现光靠现有的数采方式纯怼pretraining还是不够的,开始转向Post-Training * 22:32 Language Model的启发:数据飞轮到瓶颈后,RL是更好利用数据的方式 * 26:12 经验学习:不只学对的,从错误中也能学——看别人失败的视频也能学开车 * 26:47 RECAP的聪明:把问题切得很好,每部分都stable,接起来就好用 Sunday:数据采集革命 * 27:48 200美元手套:Skill Capture Glove让普通人在家就能采集数据 * 28:50 两指到三指:三指是复杂度和通用性的最佳平衡点 * 31:03 Long Horizon的真相:线性"长程任务"只是model prediction,分支场景才有挑战 * 33:02 范式跃迁实证:Dishwasher demo从"10人1年"变成"1人1周" 中美格局与Evaluation * 34:17 路径分野:国内注重落地和system,硅谷像OpenAI一样"不落地"做Research * 36:37 机器人特殊性:causal system无法做offline benchmark,线上evaluation成本太大 * 37:51 国家标准的尝试:中国已有具身智能相关团标和国标,但"通用"这个东西太难定义 * 39:23 评测悖论:用uncertain的世界模型去评测uncertain的policy,是否合理? 具身形态与落地 * 42:19 迭代速度优先:形态次要,关键是"怎么加快迭代速度" * 43:22 硬件是天花板:想法验证阶段把天花板定太低是不利的 * 45:02 Superhuman才有价值:搬更重、看更精、天上飞、水下游——要有differentiation * 49:19 殊途同归:工业派心里都有走向家庭的梦想,南坡北坡都在攀登同一座山 * 50:56 PC类比:最早的PC也没定义用户任务,卖给Developer让他们自己想 未来预测 * 57:18 乐观派:三年内会出现具身的ChatGPT时刻 * 58:02 谨慎派:周期性过程,最近两年轻算法偏工程 * 59:18 建设派:真正产生value要10年,一半以上问题跟硬件有关 4 |🅰️ 关于我们 Alphaist:一家生于2025的美元新基金,和它的十年赌局 如果你喜欢The Alphaist的播客内容,希望参与我们整个探索和创作过程,欢迎加入我们:加入我们|品牌内容负责人/实习生招聘中 微信公众号:Alphaist Partners
1|📒The Alphaist 播客栏目介绍 《The Alphaist》 是一档由Alphaist Partners打造的深度对话栏目。 我们关注技术与创业的第一性原理,聚焦那些正在改变世界的早期创始人、工程师与产品探索者。 每期节目,我们会围绕一个具体的科技创业方向展开深度对话。在这里,我们不追热点、不讲空洞概念,而是用最真实的一线经验去回答创业者最关心的问题:什么值得做?为什么是现在?我们应该怎样做? The Alphaist 相信:时代真正的机会,往往藏在那些不喧嚣、但正在被新技术、新需求、新产品悄然改变的新生领域。 我们希望用这档节目,陪伴新一代的 Alpha 创业者们,记录与见证那些改变世界的勇敢开始。 📢 我们建了一个 The Alphaist 行业交流群,希望聚集同频的一线工程师、研究者与创业者,在这里分享行业进展、一手消息,以及任何还没琢磨透的问题。为保持良好的社群氛围,入群需经过审核,点击链接填写申请问卷:https://alphaist.feishu.cn/share/base/form/shrcn8vew7eoXd6Vk8VPjrIXJAN 2|🤖本期播客介绍 2024年11月,三家硅谷公司几乎同时投下重磅炸弹:Generalist AI 宣称找到了机器人领域的 Scaling Law,Physical Intelligence 发布了能从错误中学习的 π0.6,Sunday Robotics 用一只200美元的手套重新定义数据采集。 这不是巧合,而是一个信号——具身智能可能正在逼近它的"ChatGPT时刻"。 但真相远比Demo复杂:27万小时数据够不够?机器人真的会涌现吗?为什么"端到端"让工程师又爱又恨?当硅谷还在Research Lab模式里探索时,中国公司已在问"三年内能做什么产品"——谁会笑到最后? 本期嘉宾: * 冯思远:Toyota Research Institute 研究员,Diffusion Policy 联合作者 * 俞冠廷 (Peter Yu):XYZ Robotics CTO * 张强 (Jony):国地共建具身智能机器人创新中心首席研究员 我们将深入讨论: * Scaling 的信仰:Generalist 声称找到 Scaling Law,但怎样定义Scaling Law? * 从模仿到经验:Physical Intelligence 为什么让机器人"从错误中学习"? * 数据革命:Sunday 的三指手套能否打破数据采集瓶颈? * Evaluation 困境:没有公认的 Benchmark,我们怎么知道在爬“正确”的山? * 形态之争:为什么三家最前沿的公司都选择了"非人形"? * 中美路径:Research Lab vs 产品导向,哪种模式更适合探索期? 3|🕙时间轴 研究范式转变 * 05:12 范式转向:Diffusion Policy让监督学习"又可以了",完美接上LLM趋势 * 07:53 工程务实:Right tool for the right job,VLA每次evaluate都很expensive * 08:28 端到端代价:模块化可以写Spec做Unit Test,VLA只能说"大概能跑" * 10:34 意外的跨界:π0.6出来后,来讨论的反而是自动驾驶的人——他们每天能用的数据不到1% Generalist:Scaling的信仰 * 12:04 Bet against Scaling Law,基本上不是一个好主意 * 12:58 Evaluation困境:没人知道task长什么样,没人能复现任何实验 * 15:18 数据质量的隐忧:两只手夹爪做daily life,但工业场景用吸盘吸箱子——这很难transfer * 17:07 Harmonic Reasoning:可能是observation和action同步predict,不是新想法,但工程实现很难 Physical Intelligence:从错误中学习 * 21:21 路径转变:采了很多数据后发现光靠现有的数采方式纯怼pretraining还是不够的,开始转向Post-Training * 22:32 Language Model的启发:数据飞轮到瓶颈后,RL是更好利用数据的方式 * 26:12 经验学习:不只学对的,从错误中也能学——看别人失败的视频也能学开车 * 26:47 RECAP的聪明:把问题切得很好,每部分都stable,接起来就好用 Sunday:数据采集革命 * 27:48 200美元手套:Skill Capture Glove让普通人在家就能采集数据 * 28:50 两指到三指:三指是复杂度和通用性的最佳平衡点 * 31:03 Long Horizon的真相:线性"长程任务"只是model prediction,分支场景才有挑战 * 33:02 范式跃迁实证:Dishwasher demo从"10人1年"变成"1人1周" 中美格局与Evaluation * 34:17 路径分野:国内注重落地和system,硅谷像OpenAI一样"不落地"做Research * 36:37 机器人特殊性:causal system无法做offline benchmark,线上evaluation成本太大 * 37:51 国家标准的尝试:中国已有具身智能相关团标和国标,但"通用"这个东西太难定义 * 39:23 评测悖论:用uncertain的世界模型去评测uncertain的policy,是否合理? 具身形态与落地 * 42:19 迭代速度优先:形态次要,关键是"怎么加快迭代速度" * 43:22 硬件是天花板:想法验证阶段把天花板定太低是不利的 * 45:02 Superhuman才有价值:搬更重、看更精、天上飞、水下游——要有differentiation * 49:19 殊途同归:工业派心里都有走向家庭的梦想,南坡北坡都在攀登同一座山 * 50:56 PC类比:最早的PC也没定义用户任务,卖给Developer让他们自己想 未来预测 * 57:18 乐观派:三年内会出现具身的ChatGPT时刻 * 58:02 谨慎派:周期性过程,最近两年轻算法偏工程 * 59:18 建设派:真正产生value要10年,一半以上问题跟硬件有关 4 |🅰️ 关于我们 Alphaist:一家生于2025的美元新基金,和它的十年赌局 如果你喜欢The Alphaist的播客内容,希望参与我们整个探索和创作过程,欢迎加入我们:加入我们|品牌内容负责人/实习生招聘中 微信公众号:Alphaist Partners


