📝 本期播客简介本期我们克隆了与人工智能领域顶尖专家 Łukasz Kaiser 的深度对话。Łukasz 是一位波兰数学家和计算机科学家,也是那篇开启生成式A I时代的里程碑论文《Attention is All You Need》(Transformer模型)的八位作者之一。他曾任Google Brain主任研究科学家,自2021年起在OpenAI担任研究员,负责过G P T 4长上下文项目,并领导团队催生了最新版ChatGPT中使用的O1推理模型。 在这期节目中,Łukasz将带我们回顾Transformer的诞生,揭示其如何从一个“普通”研究想法演变为A I基石。更重要的是,他将深入探讨A I发展的“新范式”——推理模型。与传统大语言模型预测下一个词不同,推理模型能进行内部思考、调用外部工具,从而实现更高效的学习、更少的幻觉,并有望加速科学发展。Łukasz驳斥了“A I冬天”的说法,预言未来一两年A I将迎来“令人害怕”的迅猛进步,并分享了OpenAI构建有益通用人工智能的愿景。他还讨论了A I在自动化工作、多模态训练、以及如何应对社会挑战等方面的深刻见解。这不仅是一次技术前沿的探索,更是对A I如何重塑我们世界的一次深思。翻译克隆自:El Cerebro detrás de OpenAI y Google 🤖 | 🎙️ Łukasz Kaiser, Lead Researcher en OpenAI - Podcast IA 🟣👨⚕️ 本期嘉宾Łukasz Kaiser,波兰数学家和计算机科学家,Transformer模型论文《Attention is All You Need》的八位作者之一。曾任Google Brain主任研究科学家,自2021年起在OpenAI担任研究员,负责过GPT-4长上下文项目,并领导团队催生了最新版ChatGPT中使用的O1推理模型。⏱️ 时间戳00:00 开场 & 播客简介AI新范式:推理模型的崛起02:14 Transformer开启生成式AI时代:Łukasz作为作者之一的感受02:53 推理模型:AI发展的新范式,处于极其陡峭的上升阶段03:14 推理模型与AGI:数据需求更少,有望加速科学发展03:43 AI发展的瓶颈:GPU和能源04:04 AI冬天论:Łukasz驳斥,预言未来一两年AI将迅猛进步05:22 智能的定义:超越目标,纯粹的好奇心07:11 OpenAI的愿景:构建有益通用人工智能,推动科学进步08:22 AI的强大力量:机遇与挑战并存,政府应密切关注09:02 AI发展速度:数字化世界桥梁可快速搭建,但需持续观察10:09 OpenAI的使命:构建有益AGI,赋能人类,推动科学AI对工作与社会的影响11:02 AGI的定义与发展:AI与人类智能的根本差异,自动化任务的未来13:01 AI自动化工作:从任务取代到工作辅助,快速普及的电脑任务自动化15:58 AI在编程领域的进展:模型成为程序员的得力助手,代码生成与审查能力惊人19:03 AI进步的瓶颈:算力限制与模型迭代周期20:48 研究与发布:技术发现到产品落地的漫长周期22:17 模型再训练:GPT-4到GPT-4o的演进,兼顾性能与成本23:13 模型优化策略:做大模型与模型蒸馏24:03 OpenAI的转变:从研究实验室到服务近十亿用户的公司25:08 算力争夺战:Sam Altman的努力与GPU的极限26:43 AI发展趋势:旧范式接近极限,新范式(推理)陡峭上升27:58 推理模型:从预测下一个词到内部思考与工具调用30:49 AI进步的动力:突破性研究与经济驱动33:20 Transformer的诞生:从普通研究想法到AI基石38:39 Transformer的应用:从翻译到语言模型,数据效率的提升39:15 推理模型的起源:ChatGPT问世前两年的研究积累42:51 老式大语言模型与推理模型的区别:预测下一个词 vs 内部思考与工具调用44:05 推理模型的工具调用:网页搜索、Python代码执行与MCP协议45:34 思维链:推理模型接近AGI的体现46:09 推理模型的训练:强化学习与先验知识的重要性47:02 推理模型的优势:从错误中学习,更长时间的思考与验证48:55 推理的本质:模仿输出,通过思考达到结果50:43 推理模型:学习数据量更少,泛化能力更强,重大范式转变AI的未来与挑战51:57 推理模型的潜力:从编程到科学加速,尚未找到真正的“引爆点”55:30 AI的创造力:加速科学发现与执行,而非凭空创造58:02 AI在日常工作中的应用:代码辅助、实验运行与合成数据生成01:03:05 模型速度与效率:蒸馏技术与算力瓶颈01:05:46 AI进步的动力:持续的工程改进与新研究突破01:09:31 AI的进步空间:模型仍不完美,巨大改进潜力01:10:30 推理模型的未来:并行化与从任意数据中学习01:13:44 Pulse功能:AI的“思考”与更完善的答案01:14:40 多模态训练:视频、音频等数据对AI理解世界的重要性01:17:35 机器人与AI:物理世界理解的突破与层级结构01:21:49 世界模型:语言模型理解抽象世界,多模态填补物理世界空白01:22:17 AGI的定义:Demis Hassabis的观点与推理模型的潜力01:23:54 物理世界理解:视频训练与机器人技术的发展01:27:17 AI幻觉:产生机制与推理模型的解决方案01:31:48 幻觉的解决:数据调整、强化学习与推理过程01:33:22 模型的不对齐:思维链与最终答案的差异01:35:59 思维链的展示:美学与安全考量01:39:19 AI研究者的自豪与压力:谷歌与OpenAI的文化变迁01:41:13 AI竞争:共同目标与信息流动01:43:12 进步的代价:昂贵的算力投入与实验失败01:44:40 其他实验室:Anthropic、Grok与Meta的AI发展01:45:31 AI垃圾内容与武器:研究者的担忧与政府的责任01:48:55 OpenAI的订阅模式:避免用户参与度优化,实现有益AI01:50:05 商业模式的挑战:广告与佣金的平衡01:52:01 产品推荐:确保模型公平性,不受商业协议影响01:53:13 市场压力:OpenAI的坚持与挑战01:54:20 OpenAI硬件设备:Jony Ive的参与与未来愿景01:55:30 订阅模式的坚持:不为用户参与度优化01:58:06 AI的未来愿景:解决平凡问题,加速科学进步02:00:01 AI与教育:导师潜力与作弊风险02:00:49 乐观与怀疑:对技术进步的看法与社会责任02:02:50 AI的社会责任:如何正确使用技术,避免负面影响02:04:05 AI的进步与社会适应:持续改进与生活扰动02:07:45 结束语:对Łukasz Kaiser的感谢与对AI未来的期望🌐 播客信息补充本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的使用 AI 进行翻译,因此可能会有一些地方不通顺;如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
No persons identified in this episode.
This episode hasn't been transcribed yet
Help us prioritize this episode for transcription by upvoting it.
Popular episodes get transcribed faster
Other recent transcribed episodes
Transcribed and ready to explore now
Trump $82 Million Bond Spree, Brazil Tariffs 'Too High,' More
16 Nov 2025
Bloomberg News Now
Ex-Fed Gov Resigned After Rules Violations, Trump Buys $82 Mil of Bonds, More
16 Nov 2025
Bloomberg News Now
THIS TRUMP INTERVIEW WAS INSANE!
16 Nov 2025
HasanAbi
Epstein Emails and Trump's Alleged Involvement
15 Nov 2025
Conspiracy Theories Exploring The Unseen
New Epstein Emails Directly Implicate Trump - H3 Show #211
15 Nov 2025
H3 Podcast
Trump Humiliates Himself on FOX as They Call Him Out
15 Nov 2025
IHIP News