“某种意义上讲,人就是活在幻觉中,只要自恰就可以。”DeepSeek R1的横空出世,让“长思维链”这个技术圈的专业术语走进了公众视野。但在这场技术革命的背后,一个更深层的问题正在浮现:AI真的学会思考了吗?从OpenAI的O1到DeepSeek的R1,从快思考到慢思考,从预训练到推理时代——这不仅是技术路径的演进,更像是人工智能向着真正的“智能”迈出的关键一步。当模型开始展现出类似人类的“深思熟虑”,当它们能够通过长达数万字的推理过程解决复杂问题时,我们是否正在见证通用人工智能(AGI)的曙光?下一代推理新范式是什么?系统一和系统二的融合为何如此困难?本期《会友镖局》,我们邀请到武威,这位从北大数学系走出、历经微软亚洲研究院和微软小冰的AI科学家,一位既有深厚数学功底又富有哲学思辨的技术人,将为我们深度解析推理范式革命的本质。让我们跟随武威的视角,一起探索这场正在发生的AI思维革命。👩 本期人物主持人: 蚂蚁集团 友红 嘉宾: 蚂蚁技术研究院自然语言处理负责人 武威⏱️ 本期时间轴02:27 R1的历史意义,开启长推理链时代从技术圈视角评价R1的两大贡献:一是以极低成本快速复现了OpenAI O1的效果,二是公开技术细节推动了整个行业发展。在O1发布后,由于OpenAI未公布任何技术细节,整个行业都在猜测其实现方式。直到R1公布了通过强化学习实现长思维链的方法,大模型领域才真正进入了“长推理链时代”。08:47 从Scaling Law到Test Time Scaling面对“Scaling Law是否见顶”的质疑,武威提出了新视角:当训练数据接近枯竭时,“Test Time Scaling”成为新的突破口。用建造宫殿来做比喻:预训练像收集材料,而推理时计算则是如何组合这些材料。即使材料有限,通过不同的组合方式仍能创造出无限可能。14:58 推理的本质,是用逻辑组合出新的知识追溯到2011年Bottou的论文和明斯基的《思维社会》,推理就是“代数组合已有知识去解决新问题”,包含三个关键要素:代数结构、知识组合、新问题求解。人脑中有许多小的Agent,在复杂问题来临时被激活并组合,形成解决方案。21:18 幻觉与认知,人类也活在“幻觉”中用数学家伽罗瓦的故事说明,我们可能因为没有见过或理解某些事物而认为它是幻觉。“某种意义上讲,人就是活在幻觉中,只要自恰就可以。”这引发了对AI“幻觉”问题的深层思考:关键不在于消除幻觉,而在于构建自恰的认知体系。29:25 当前范式的困境——用语言模型做推理的无奈“为什么大家还是去接受这样的一个范式?因为目前来看最有效的就是这么一个范式。”,我们知道用语言模型做推理不是最优解,但找不到更好的方法。现在的做法本质上还是“Token by Token”的概率生成,缺乏专门的推理数学模型。36:34 从“做题家”变成“产品经理”,才是推理模型的未来当前的推理模型主要在解决数学、编程等结构化问题,像是“做题家”。但未来的推理应该能够泛化到更广泛的领域:成为优秀的产品经理、销售人员等。这需要模型不仅能够逻辑推理,还要理解人类需求、进行创造性思考。45:36“ 多”、“快”、“好”、“省”,推理模型的发展路径短期来看,推理发展有两条清晰路线:一是提升效率,解决R1等模型太慢、成本太高的问题;二是扩大应用范围,从数学编程扩展到理解人类偏好、情绪等更多领域。长期目标是找到推理的正确数学模型,实现真正的快慢思考融合。50:02 什么是真正的智能?引用明斯基的观点,真正的智能是当问题来临时,系统能够找到最优的Agent组合,并以最优方式串联解决问题。这涉及两个最优选择恰当的能力单元,以及用最低能耗的方式组合它们。从处理到理解到生成到推理,这是AI从单点发展到组合的必然过程。🎯 核心观点· DeepSeek R1的历史意义:不在于技术本身,而在于通过开源推动整个行业进入长推理链时代· Test Time Scaling是新方向:当训练数据枯竭,如何在推理时更好地组合知识成为关键● 推理即是组合:用逻辑(代数结构)组合已有知识解决新问题· 当前范式的局限:用语言模型做推理是"用锤子当螺丝刀",需要专门的推理架构· 从专才到通才:未来推理需要从解题泛化到更广泛的创造性工作· 认知的自恰性:关键不在于消除幻觉,而在于构建自恰的认知体系· 智能的本质:找到最优的能力单元组合,以最低能耗解决复杂问题🏢 关于蚂蚁技术研究院蚂蚁技术研究院是蚂蚁集团的前言技术研发机构,在自然语言处理、机器学习、安全计算等前沿领域持续投入,致力于推动人工智能技术的创新与应用。运营:狐狸 更多节目信息,欢迎关注小红书:会友播客 添加小助手微信:huiyouhz,可以加入听友群喔
No persons identified in this episode.
This episode hasn't been transcribed yet
Help us prioritize this episode for transcription by upvoting it.
Popular episodes get transcribed faster
Other recent transcribed episodes
Transcribed and ready to explore now
Trump $82 Million Bond Spree, Brazil Tariffs 'Too High,' More
16 Nov 2025
Bloomberg News Now
Ex-Fed Gov Resigned After Rules Violations, Trump Buys $82 Mil of Bonds, More
16 Nov 2025
Bloomberg News Now
THIS TRUMP INTERVIEW WAS INSANE!
16 Nov 2025
HasanAbi
Epstein Emails and Trump's Alleged Involvement
15 Nov 2025
Conspiracy Theories Exploring The Unseen
New Epstein Emails Directly Implicate Trump - H3 Show #211
15 Nov 2025
H3 Podcast
Trump Humiliates Himself on FOX as They Call Him Out
15 Nov 2025
IHIP News