Menu
Sign In Search Podcasts Charts People & Topics Add Podcast API Pricing
Podcast Image

跨国串门儿计划

#276. Łukasz Kaiser: Transformer的诞生、推理模型与AI的未来

27 Oct 2025

Description

📝 本期播客简介本期我们克隆了与人工智能领域顶尖专家 Łukasz Kaiser 的深度对话。Łukasz 是一位波兰数学家和计算机科学家,也是那篇开启生成式A I时代的里程碑论文《Attention is All You Need》(Transformer模型)的八位作者之一。他曾任Google Brain主任研究科学家,自2021年起在OpenAI担任研究员,负责过G P T 4长上下文项目,并领导团队催生了最新版ChatGPT中使用的O1推理模型。 在这期节目中,Łukasz将带我们回顾Transformer的诞生,揭示其如何从一个“普通”研究想法演变为A I基石。更重要的是,他将深入探讨A I发展的“新范式”——推理模型。与传统大语言模型预测下一个词不同,推理模型能进行内部思考、调用外部工具,从而实现更高效的学习、更少的幻觉,并有望加速科学发展。Łukasz驳斥了“A I冬天”的说法,预言未来一两年A I将迎来“令人害怕”的迅猛进步,并分享了OpenAI构建有益通用人工智能的愿景。他还讨论了A I在自动化工作、多模态训练、以及如何应对社会挑战等方面的深刻见解。这不仅是一次技术前沿的探索,更是对A I如何重塑我们世界的一次深思。翻译克隆自:El Cerebro detrás de OpenAI y Google 🤖 | 🎙️ Łukasz Kaiser, Lead Researcher en OpenAI - Podcast IA 🟣👨‍⚕️ 本期嘉宾Łukasz Kaiser,波兰数学家和计算机科学家,Transformer模型论文《Attention is All You Need》的八位作者之一。曾任Google Brain主任研究科学家,自2021年起在OpenAI担任研究员,负责过GPT-4长上下文项目,并领导团队催生了最新版ChatGPT中使用的O1推理模型。⏱️ 时间戳00:00 开场 & 播客简介AI新范式:推理模型的崛起02:14 Transformer开启生成式AI时代:Łukasz作为作者之一的感受02:53 推理模型:AI发展的新范式,处于极其陡峭的上升阶段03:14 推理模型与AGI:数据需求更少,有望加速科学发展03:43 AI发展的瓶颈:GPU和能源04:04 AI冬天论:Łukasz驳斥,预言未来一两年AI将迅猛进步05:22 智能的定义:超越目标,纯粹的好奇心07:11 OpenAI的愿景:构建有益通用人工智能,推动科学进步08:22 AI的强大力量:机遇与挑战并存,政府应密切关注09:02 AI发展速度:数字化世界桥梁可快速搭建,但需持续观察10:09 OpenAI的使命:构建有益AGI,赋能人类,推动科学AI对工作与社会的影响11:02 AGI的定义与发展:AI与人类智能的根本差异,自动化任务的未来13:01 AI自动化工作:从任务取代到工作辅助,快速普及的电脑任务自动化15:58 AI在编程领域的进展:模型成为程序员的得力助手,代码生成与审查能力惊人19:03 AI进步的瓶颈:算力限制与模型迭代周期20:48 研究与发布:技术发现到产品落地的漫长周期22:17 模型再训练:GPT-4到GPT-4o的演进,兼顾性能与成本23:13 模型优化策略:做大模型与模型蒸馏24:03 OpenAI的转变:从研究实验室到服务近十亿用户的公司25:08 算力争夺战:Sam Altman的努力与GPU的极限26:43 AI发展趋势:旧范式接近极限,新范式(推理)陡峭上升27:58 推理模型:从预测下一个词到内部思考与工具调用30:49 AI进步的动力:突破性研究与经济驱动33:20 Transformer的诞生:从普通研究想法到AI基石38:39 Transformer的应用:从翻译到语言模型,数据效率的提升39:15 推理模型的起源:ChatGPT问世前两年的研究积累42:51 老式大语言模型与推理模型的区别:预测下一个词 vs 内部思考与工具调用44:05 推理模型的工具调用:网页搜索、Python代码执行与MCP协议45:34 思维链:推理模型接近AGI的体现46:09 推理模型的训练:强化学习与先验知识的重要性47:02 推理模型的优势:从错误中学习,更长时间的思考与验证48:55 推理的本质:模仿输出,通过思考达到结果50:43 推理模型:学习数据量更少,泛化能力更强,重大范式转变AI的未来与挑战51:57 推理模型的潜力:从编程到科学加速,尚未找到真正的“引爆点”55:30 AI的创造力:加速科学发现与执行,而非凭空创造58:02 AI在日常工作中的应用:代码辅助、实验运行与合成数据生成01:03:05 模型速度与效率:蒸馏技术与算力瓶颈01:05:46 AI进步的动力:持续的工程改进与新研究突破01:09:31 AI的进步空间:模型仍不完美,巨大改进潜力01:10:30 推理模型的未来:并行化与从任意数据中学习01:13:44 Pulse功能:AI的“思考”与更完善的答案01:14:40 多模态训练:视频、音频等数据对AI理解世界的重要性01:17:35 机器人与AI:物理世界理解的突破与层级结构01:21:49 世界模型:语言模型理解抽象世界,多模态填补物理世界空白01:22:17 AGI的定义:Demis Hassabis的观点与推理模型的潜力01:23:54 物理世界理解:视频训练与机器人技术的发展01:27:17 AI幻觉:产生机制与推理模型的解决方案01:31:48 幻觉的解决:数据调整、强化学习与推理过程01:33:22 模型的不对齐:思维链与最终答案的差异01:35:59 思维链的展示:美学与安全考量01:39:19 AI研究者的自豪与压力:谷歌与OpenAI的文化变迁01:41:13 AI竞争:共同目标与信息流动01:43:12 进步的代价:昂贵的算力投入与实验失败01:44:40 其他实验室:Anthropic、Grok与Meta的AI发展01:45:31 AI垃圾内容与武器:研究者的担忧与政府的责任01:48:55 OpenAI的订阅模式:避免用户参与度优化,实现有益AI01:50:05 商业模式的挑战:广告与佣金的平衡01:52:01 产品推荐:确保模型公平性,不受商业协议影响01:53:13 市场压力:OpenAI的坚持与挑战01:54:20 OpenAI硬件设备:Jony Ive的参与与未来愿景01:55:30 订阅模式的坚持:不为用户参与度优化01:58:06 AI的未来愿景:解决平凡问题,加速科学进步02:00:01 AI与教育:导师潜力与作弊风险02:00:49 乐观与怀疑:对技术进步的看法与社会责任02:02:50 AI的社会责任:如何正确使用技术,避免负面影响02:04:05 AI的进步与社会适应:持续改进与生活扰动02:07:45 结束语:对Łukasz Kaiser的感谢与对AI未来的期望🌐 播客信息补充本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的使用 AI 进行翻译,因此可能会有一些地方不通顺;如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

Audio
Featured in this Episode

No persons identified in this episode.

Transcription

This episode hasn't been transcribed yet

Help us prioritize this episode for transcription by upvoting it.

0 upvotes
🗳️ Sign in to Upvote

Popular episodes get transcribed faster

Comments

There are no comments yet.

Please log in to write the first comment.