#159. AI推理的“快与慢”：与OpenAI研究员Noam Brown聊智能体

Description

📝 本期播客简介本期我们克隆了：Scaling Test Time Compute to Multi-Agent Civilizations — Noam Brown, OpenAI他们邀请到OpenAI的重磅研究员诺姆·布朗（Noam Brown）。诺姆不仅是能媲美顶尖人类玩家的《外交》AI“西塞罗”的创造者，更是凭借对AI策略的深刻理解摘得该游戏世界冠军的传奇人物。在本期节目中，诺姆将从这段经历出发，深入剖析OpenAI内部备受瞩目的O系列推理模型，并用“思考，快与慢”的生动类比，揭示AI进行深度推理的奥秘。你还将听到他对多智能体系统构建“AI文明”的宏大构想、对AI编程未来的展望，以及关于OpenAI如何做出关键技术路线决策的珍贵幕后故事。👨‍⚕️ 本期嘉宾诺姆·布朗（Noam Brown），OpenAI研究员。他因在Meta AI工作期间领导开发了在复杂策略游戏《外交》中取得突破的AI“西塞罗”（Cicero）而闻名，并于2022年亲自赢得《外交》世界冠军。此前，他因在扑克AI（Libratus）领域的研究而备受赞誉。他的工作专注于AI推理、多智能体系统和博弈论的前沿。📒 文字版精华见微信公众号（点击跳转）⏱️ 时间戳00:55 开场总结外交AI“西塞罗”的幕后02:09 开发AI如何帮助Noam赢得世界冠军04:09 早期语言模型的局限与AI安全性的思考O系列推理模型与OpenAI的研发哲学07:21 O系列模型的快速进展与Deep Research的应用10:48 “思考，快与慢”：AI推理的系统1与系统2类比及其局限15:05 “束缚装置”与模型路由：临时拐杖终将被规模化淘汰22:01 强化学习微调(RFT)为何能超越模型迭代22:49 推理范式的诞生：与Ilya Sutskever的对话及OpenAI的内部博弈AI编程、数据效率与未来工作29:59 数据效率：AI领域最重要的未解难题之一33:36 Noam Brown的编程工作流：如何“压榨”Codex并“感受AGI”39:20 AI的未来：从编程助手到胜任各类远程办公任务多智能体、博弈论与机器人学41:37 多智能体研究：从“AI穴居人”到“AI文明”45:07 深度解析扑克AI：GTO策略与剥削性打法的权衡53:30 自我对弈的局限：为何AlphaGo的成功范式难以复制59:10 机器人学的挑战：硬件迭代的痛苦与人形机器人的反思快问快答 & 总结01:03:01 顶尖实验室如何追踪前沿研究01:05:42 “测试时计算”的瓶颈：成本与时间墙01:11:25 游戏推荐：《血染钟楼》01:12:30 AI能征服《万智牌》这样的复杂游戏吗？🌟 精彩内容西塞罗的传奇: 从开发AI到赢得世界冠军的独特经历，以及对AI安全的可控性启发。“思考，快与慢”新解: 揭示推理模型（O系列）如何工作，以及其成功的先决条件——一个足够强大的基础模型。OpenAI内部故事: 关于推理范式如何诞生、与Ilya Sutskever的对话，以及内部关于技术路线的决策与博弈。“惨痛教训”的普适性: 为什么“束缚装置”、模型路由等复杂工程最终可能被纯粹的规模化所淘汰。博弈论AI深度剖析: 从扑克到《外交》，探讨GTO（博弈论最优）与剥削性策略的差异，以及自我对弈在复杂系统中的局限性。AI的未来形态: 探讨AI如何从编程助手扩展到更广泛的认知工作，以及多智能体系统如何通过协作竞争构建“AI文明”。🌐 播客信息补充翻译克隆自：Scaling Test Time Compute to Multi-Agent Civilizations — Noam Brown, OpenAI本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight

Audio

Featured in this Episode

No persons identified in this episode.

Transcription

This episode hasn't been transcribed yet

Help us prioritize this episode for transcription by upvoting it.

0 upvotes

🗳️ Sign in to Upvote

Popular episodes get transcribed faster

Other recent transcribed episodes

Transcribed and ready to explore now

Trump $82 Million Bond Spree, Brazil Tariffs 'Too High,' More

16 Nov 2025

Bloomberg News Now

Ex-Fed Gov Resigned After Rules Violations, Trump Buys $82 Mil of Bonds, More

16 Nov 2025

Bloomberg News Now

THIS TRUMP INTERVIEW WAS INSANE!

16 Nov 2025

HasanAbi

Epstein Emails and Trump's Alleged Involvement

15 Nov 2025

Conspiracy Theories Exploring The Unseen

New Epstein Emails Directly Implicate Trump - H3 Show #211

15 Nov 2025

H3 Podcast

Trump Humiliates Himself on FOX as They Call Him Out

15 Nov 2025

IHIP News

Comments

There are no comments yet.

Please log in to write the first comment.

跨国串门儿计划

This episode hasn't been transcribed yet

Other recent transcribed episodes

Trump $82 Million Bond Spree, Brazil Tariffs 'Too High,' More

Ex-Fed Gov Resigned After Rules Violations, Trump Buys $82 Mil of Bonds, More

THIS TRUMP INTERVIEW WAS INSANE!

Epstein Emails and Trump's Alleged Involvement

New Epstein Emails Directly Implicate Trump - H3 Show #211

Trump Humiliates Himself on FOX as They Call Him Out

Login Required