Skip to main content
OnBoard! 封面
小宇宙

OnBoard! 音频下载

主播 莫妮卡同学、NLive

节目速览

两位投资人主持,邀请横跨中美的一线研究员,从技术本质到行业影响,硬核拆解DeepSeek R1的强化学习、Long CoT与开源生态,三个多小时超长干货。

适合人群

关注AI前沿的科技从业者与投资人

热门下载单集

根据本站下载次数排行榜,推荐热门下载单集。

EP 67. 解析DeepSeek R1技术创新与生态影响:强化学习,Long CoT,数据,Agent与开源生态

2025年第一期OnBoard! 让大家久等了!没错,这个话题我们怎么能绕的过去:Deepseek! Deepseek 春节前夕发布的开源推理模型 Deepseek r1,无疑是整个世界最令人关注的新闻,不论你过去是否关注 AI,相信都已经被关于 Deepseek 的各种新闻和解读轰炸了好久。但是 OnBoard! 的硬核讨论,迟来却不过时。 Hello World, who is OnBoard!? Deepseek R1 在数学、代码和各种推理能力比肩市面上最强的 OpenAI o1 正式版模型,同时又以其技术创新带来的极低的训练和推理成本,以及完全开源的特点,点燃了全世界对于推理模型,以及中国AI实力的关注。 在各种讨论的虚虚实实中,OnBoard! 一直想做的,就是找到尽可能全面和客观的视角,追寻到技术和创新的本质。于是,我们邀请到了横跨中美的一线研究员和从业者,跟大家聊聊: * 到底如何看待 Deepseek 一系列模型的创新? * 推理模型最核心的难点是什么? * DeepSeek 会对开源大模型生态带来哪些变化? 这次嘉宾也是站在学术和开源的前沿: * 有备受关注的、最早尝试复现 r1 能力的 TinyZero 项目的一作, * 有来自卡耐基梅隆大学研究推理最核心的 Long COT (Chain of Thoughts) 的研究员, * 还有返场嘉宾,前 Google Tensorflow 成员、Huggingface 社区资深贡献者。 他们从推理、COT、infra和开源几个角度,从技术本质到行业影响,兼顾发散和深度地畅聊关于 Deepseek 的已知和未知,过去与未来。相信已经非常饱和的各种信息中,还可以给大家带来一些启发。 需要说明的是,其中来自 SGlang 的嘉宾因为临时原因没有参与录制,与他的补录正好又是关于模型推理的专业话题,我们就决定放在下一期作为一个相对技术的 bonus episode. 很快会放出来,敬请期待! 毫不意外,这次讨论又是长达三个多小时。但是一定值得你的时间!Enjoy! 嘉宾介绍 * Xiang Yue, 岳翔 (个人主页), Postdoc @CMU, 师从 Prof. Graham Neubig,专注于提升模型推理能力的前沿专家 * Jiayi Pan, 潘家怡 (个人主页), PhD @Berkeley AI Research, 师从 Alane Suhr * Tiezhen Wang, Huggingface 资深工程师,前 Google Tensorflow 资深工程师 * OnBoard! 主持:Monica(小红书/即刻:莫妮卡同学):美元VC投资人,前 AWS 硅谷团队+ AI 创业公司打工人,公众号M小姐研习录 (ID: MissMStudy) 主理人 PS 欢迎关注 Xiang Yue 最新的论文,Demystifying Long CoT Reasoning in LLMs(arxiv.org)关于 Long CoT 在模型推理能力中的作用有很有意思的发现! 我们都聊了什么 解析 DeepSeek R1 技术核心 03:34 几位嘉宾自我介绍,fun fact: DeepSeek R1 让你惊艳的使用场景是什么? 好的文笔是背诵还是理解? 17:53 如果用 RL 生产数据越来越重要,还需要人类标注数据吗? 23:52 DeepSeek R1-Zero 为什么值得关注?跟R1是什么关系?TinyZero 复现 R1 的过程中有什么启发? 35:11 为什么看似简单的 Long CoT 的做法,一直到现在才被广泛用起来?Long CoT 的研究沿革和进展是怎样的? 48:29 推理模型的 Aha Moment 是什么?跟模型的“涌现能力”有什么关系? 51:13 澄清一下!正确理解“成本30美金”! 52:36 Long CoT 的实现有什么难点?DeepSeek 做了哪些值得关注的创新? 58:33 做 Coding agent 的经验:模型 coding 能力能泛化到更广泛的 Agent 能力吗? 62:32 SFT 在R1 训练中的作用?RL生成数据成本会比人工标注低吗? 71:46 Scale up RL 的难点是什么?为什么说这是 DeepSeek infra能力中容易被忽视的点 74:08 开源社区的 infra 限制,会对复现后续研究 RL 和推理模型相关工作有什么影响? 79:57 为什么说 Rewards and Simulators are all you need:还有哪些挑战? 94:34 MoE vs Dense model 的选择:业界已经是共识了吗? 107:29 DeepSeek 蒸馏 OpenAI 的数据了吗? 112:14 OpenAI o3 思维链中出现了中文应该如何理解? 大模型开源生态会发生什么变化 115:52 开源大模型需要将数据开源吗? 123:01 开源和闭源模型的差距会一直存在吗?这个差距对于使用者和模型公司意味着什么? 127:44 未来开源推理模型都会向 DeepSeek R1 的路线上收敛吗?对开源生态会有怎样的影响? 131:36 从 DeepSeek V3 到 R1, 有了基座模型训练推理模型,只需要几周的时间吗? 132:59 开发者选择开源还是闭源模型,有怎样的考量?今年开源大模型生态有哪些变化值得期待? 142:13 如何理解:Agentic workflow 只有短期价值,长期会被模型能力取代?Agent 公司的核心能力是什么? 未来展望与宏观思考 149:30 2025年,几位嘉宾的工作重点是什么? 155:22 AI 领域有什么过热的以及还没有被充分讨论的话题? 160:36 过去半年有什么观点的变化? 164:08 AI超越大部分人类智能的时候,你的生存意义是什么? 重点词汇 * Reinforcement Learning * Chain of Thoughts * SFT * MoE * Dense model * Agentic workflow 参考文章 * Xiang 最新的论文:Demystifying Long CoT Reasoning in LLMs * TinyZero: github.com * Deepseek V3: github.com R1: github.com R1 zero: arxiv.org mp.weixin.qq.com万字解析DeepSeek 成长史 * www.latent.space * semianalysis.com * arcprize.org 欢迎关注M小姐的微信公众号,了解更多中美软件、AI与创业投资的干货内容! M小姐研习录 (ID: MissMStudy) 欢迎在评论区留下你的思考,与听友们互动。喜欢 OnBoard! 的话,也可以点击打赏,请我们喝一杯咖啡!如果你用 Apple Podcasts 收听,也请给我们一个五星好评,这对我们非常重要。 最后!快来加入Onboard!听友群,结识到高质量的听友们,我们还会组织线下主题聚会,开放实时旁听播客录制,嘉宾互动等新的尝试。添加任意一位小助手微信,onboard666, 或者 Nine_tunes,小助手会拉你进群。期待你来!

为什么很多人会下载 OnBoard!

离线听,通勤路上补AI前沿

  • 硬核拆解DeepSeek R1技术细节与开源生态影响
  • 横跨中美一线研究员与从业者深度对谈
  • 从强化学习、Long CoT到Agent工作流全覆盖
  • 嘉宾包括TinyZero复现项目一作与CMU推理专家
  • 三个多小时超长干货,值得技术爱好者反复听

常见问题

为什么很多人会下载 OnBoard!

离线听,通勤路上补AI前沿 - 硬核拆解DeepSeek R1技术细节与开源生态影响 - 横跨中美一线研究员与从业者深度对谈 - 从强化学习、Long CoT到Agent工作流全覆盖 - 嘉宾包括TinyZero复现项目一作与CMU推理专家 - 三个多小时超长干货,值得技术爱好者反复听

OnBoard! 怎么下载到手机?

在网站输入节目链接,下载 MP3 到电脑后传输到手机,或直接用手机浏览器访问本网站下载。

下载的音频文件在哪里?

文件直接保存到你浏览器设置的下载目录,不是 app 缓存,你可以自由移动、备份、分享。

OnBoard! 音频是什么格式?

通常为 MP3 或 M4A 格式,可在任何播放器中打开。

为什么小宇宙下载的音频找不到?

小宇宙的下载功能将音频保存在 app 私有缓存中,iOS/Android 系统限制其他 app 访问。本站帮你获取可直接使用的 MP3 文件。

关于 OnBoard!

Hello World, who is OnBoard!? 两个爱码字的投资人关于科技创业与投资的真诚对话。 关注主播: Monica:美元VC投资人,前 AWS 硅谷团队+AI创业公司打工人,公众号M小姐研习录 (ID: MissMStudy) 主理人 | 即刻:莫妮卡同学 GN:前SaaS及科技投资人,Global SaaS社区Linkloud发起人,公众号我思锅我在 (ID: thinkxcloud) 主理人。| 即刻:High 宁 同名 Podcast 在各大平台都有哦: 喜马拉雅, Apple Podcasts, Spotify, Google Podcasts, Overcast 都可以找到~

下载前提醒

  • 仅在你有权访问的公开页面使用下载功能,并遵守平台规则与内容版权要求。
  • 优先复制单集链接进入本在线下载器,如果您需要批量下载,请看看我们的增强下载器。
  • 当前页面基于本在线下载器运营同事手工统计汇总及编辑内容,更新周期为一个月。
XYZ播客下载器

XYZ播客下载器

免费、简单、高效的播客下载工具

我们致力于为播客爱好者提供最便捷的离线收听解决方案。支持小宇宙播客和苹果播客平台的播客内容下载,让您随时随地享受优质音频内容。

© 2026 XYZ播客下载器 小宇宙/苹果播客音频下载器. 保留所有权利.
本工具仅供个人学习和研究使用,请尊重版权,支持原创内容。

重要提示本工具仅供个人学习和研究使用,请尊重版权,支持原创内容。下载的内容仅限个人使用,不得用于商业用途或二次分发。使用本工具即表示您同意遵守相关法律法规和平台服务条款。

用心制作为播客爱好者

OnBoard! 音频下载 | 免费 MP3 下载 | Mr. XYZ Downloader | XYZ Podcast Downloader