EP25:AI教母李飞飞-空间智能开启下一个前沿,而仅靠语言无法实现AGI
当所有人都在谈论语言大模型时,我们是否忽略了AI更根本的进化方向?本期《3D&AI》节目,我们邀请到“AI教母”、斯坦福大学教授、World Labs联合创始人李飞飞博士,她将颠覆你的认知,阐述为何诞生于五亿年前的“空间智能”——而非语言——才是人工智能真正的下一个前沿。 带着对“什么是智能”的终极追问,李飞飞博士投身AI研究数十年,如今她创立了World Labs,致力于攻克“空间智能”这一核心命题。在本期对话中,她将详细介绍其团队发布的第一个3D生成式世界模型 Marble,它如何将简单的文本或图片提示,转化为一个可交互、时空一致的虚拟世界。除了在游戏、机器人等领域的应用,Marble更带来了意想不到的惊喜——例如,为强迫症患者生成个性化的沉浸式治疗环境,为精神健康研究开辟了全新的可能性。 **您将了解到:** * 为什么说AI的下一个前沿不是语言,而是诞生于五亿年前的“空间智能”? * 除了游戏和机器人,AI生成的虚拟世界如何被用于治疗强迫症等精神健康难题? * 从自动驾驶汽车近20年的发展,我们能预见到通用机器人的未来是坦途还是充满挑战? * AI教母李飞飞为何对当前AI“乌托邦”与“末日论”的两极化讨论感到担忧? 💡时点内容 | Key Topics [00:00] **空间智能:人工智能的下一个前沿** 李飞飞博士从进化角度阐述,感知智能(视觉、触觉)远比语言智能古老,是智能发展的根基。因此,理解和与3D、4D物理世界互动的“空间智能”,是与语言智能同等重要的核心能力,代表了AI的下一个前沿。 [00:00] **Marble:首个3D生成式世界模型** World Labs发布的第一代空间智能模型Marble,能将文本、图片、视频等多模态输入,转化为可导航、可交互、时空一致且具备几何结构的3D世界。它与普通视频生成模型有本质区别,可用于机器人模拟或游戏开发。 [03:57] **世界模型的意外应用:从游戏到心理治疗** 除了游戏开发、虚拟制片和机器人训练等预期应用,Marble还收获了意外用例。例如,临床研究人员用它为强迫症患者快速生成个性化的沉浸式治疗环境,解决了传统研究中难以获取特定场景的痛点。 [07:56] **警惕AI的两极化论调:呼吁负责任的对话** 李飞飞博士对当前AI领域“技术乌托邦”与“末日论”的两极化讨论表示担忧,认为这种讨论浪费资源且不负责任。她呼吁行业和社会进行更细致、友善、负责任的对话,引导技术向善发展,而非追求点击率。 [14:31] **数据困境:世界模型与语言模型的根本差异** 与语言模型可以轻易获取海量互联网文本数据不同,构建世界模型所需的3D、4D物理世界数据极其稀缺。因此,World Labs必须采用混合数据策略,结合互联网数据、模拟数据和真实世界采集数据,这是其发展的核心挑战之一。 [18:00] **通用机器人的漫漫长路:从自动驾驶得到的启示** 李飞飞博士以自动驾驶汽车近20年的发展历程为例,说明通用机器人的实现将是一段非常漫长且困难的旅程。机器人需要在三维空间中“接触”并精细操作物体,这是比二维平面上的自动驾驶维度高得多、也更具挑战性的问题。 📺相关链接与资源 [视频来源]《3D & AI | Dr. Fei-Fei Li, CEO & Co-Founder, World Labs & Jeetu Patel》 本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来怪怪的。如想了解更多信息,请关注微信公众号"西经东译"获取AI最新资讯。如有后续想要听的其他外文播客,也欢迎联系微信:mayday2303。
当所有人都在谈论语言大模型时,我们是否忽略了AI更根本的进化方向?本期《3D&AI》节目,我们邀请到“AI教母”、斯坦福大学教授、World Labs联合创始人李飞飞博士,她将颠覆你的认知,阐述为何诞生于五亿年前的“空间智能”——而非语言——才是人工智能真正的下一个前沿。 带着对“什么是智能”的终极追问,李飞飞博士投身AI研究数十年,如今她创立了World Labs,致力于攻克“空间智能”这一核心命题。在本期对话中,她将详细介绍其团队发布的第一个3D生成式世界模型 Marble,它如何将简单的文本或图片提示,转化为一个可交互、时空一致的虚拟世界。除了在游戏、机器人等领域的应用,Marble更带来了意想不到的惊喜——例如,为强迫症患者生成个性化的沉浸式治疗环境,为精神健康研究开辟了全新的可能性。 **您将了解到:** * 为什么说AI的下一个前沿不是语言,而是诞生于五亿年前的“空间智能”? * 除了游戏和机器人,AI生成的虚拟世界如何被用于治疗强迫症等精神健康难题? * 从自动驾驶汽车近20年的发展,我们能预见到通用机器人的未来是坦途还是充满挑战? * AI教母李飞飞为何对当前AI“乌托邦”与“末日论”的两极化讨论感到担忧? 💡时点内容 | Key Topics [00:00] **空间智能:人工智能的下一个前沿** 李飞飞博士从进化角度阐述,感知智能(视觉、触觉)远比语言智能古老,是智能发展的根基。因此,理解和与3D、4D物理世界互动的“空间智能”,是与语言智能同等重要的核心能力,代表了AI的下一个前沿。 [00:00] **Marble:首个3D生成式世界模型** World Labs发布的第一代空间智能模型Marble,能将文本、图片、视频等多模态输入,转化为可导航、可交互、时空一致且具备几何结构的3D世界。它与普通视频生成模型有本质区别,可用于机器人模拟或游戏开发。 [03:57] **世界模型的意外应用:从游戏到心理治疗** 除了游戏开发、虚拟制片和机器人训练等预期应用,Marble还收获了意外用例。例如,临床研究人员用它为强迫症患者快速生成个性化的沉浸式治疗环境,解决了传统研究中难以获取特定场景的痛点。 [07:56] **警惕AI的两极化论调:呼吁负责任的对话** 李飞飞博士对当前AI领域“技术乌托邦”与“末日论”的两极化讨论表示担忧,认为这种讨论浪费资源且不负责任。她呼吁行业和社会进行更细致、友善、负责任的对话,引导技术向善发展,而非追求点击率。 [14:31] **数据困境:世界模型与语言模型的根本差异** 与语言模型可以轻易获取海量互联网文本数据不同,构建世界模型所需的3D、4D物理世界数据极其稀缺。因此,World Labs必须采用混合数据策略,结合互联网数据、模拟数据和真实世界采集数据,这是其发展的核心挑战之一。 [18:00] **通用机器人的漫漫长路:从自动驾驶得到的启示** 李飞飞博士以自动驾驶汽车近20年的发展历程为例,说明通用机器人的实现将是一段非常漫长且困难的旅程。机器人需要在三维空间中“接触”并精细操作物体,这是比二维平面上的自动驾驶维度高得多、也更具挑战性的问题。 📺相关链接与资源 [视频来源]《3D & AI | Dr. Fei-Fei Li, CEO & Co-Founder, World Labs & Jeetu Patel》 本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来怪怪的。如想了解更多信息,请关注微信公众号"西经东译"获取AI最新资讯。如有后续想要听的其他外文播客,也欢迎联系微信:mayday2303。


