Menu
Sign In Search Podcasts Charts People & Topics Add Podcast API Pricing
Podcast Image

矽谷輕鬆談 Just Kidding Tech

S2E8 LLM 可解釋性大突破:首次公開 AI 的思考路徑。Llama 4 翻車現場直擊,官方說的和你拿到的不一樣?

13 Apr 2025

Description

📣 本集感謝《天下雜誌》贊助想快速掌握每天的財經、科技、管理重點?我最近體驗了《天下每日報》App,覺得超適合像我們這種想吸收高品質內容、但沒時間每天刷一堆新聞的人。每天 8 則精選新聞+深度解析,幾分鐘就能更新知識。還有仿真人語音可以邊走邊聽,資訊密度很高但吸收很輕鬆。🎁 4/30 前使用《矽谷輕鬆談》專屬連結免費體驗 60 天(價值 NT$360),還有機會抽 AirPods 4!👉 https://bit.ly/42cE2Ph大型語言模型到底會不會「思考」🧠?這次我們終於有機會一探究竟。Anthropic 發表兩篇突破性的研究,透過名為「電路追蹤(Circuit Tracing)」的方法,第一次打開了語言模型的腦袋,讓我們看到 Claude 是如何推理、做決策、甚至提前規劃答案。這集我們聊聊:📌 為什麼 LLM 這麼難解釋?📌 MLP 到底在模型裡做了什麼?📌 CLT 是怎麼繞過黑盒、還原語意電路?📌 Claude 真的有「中間想法」還是只是唬人?📌 未來會不會出現一個完全可控、可理解的 AI?此外,當然也要來看一下Llama 4 的災難現場——表面 benchmark 飆高,實際上卻連 strawberry 都拼不對?Meta 說的和大家實際拿到的版本真的一樣嗎?ChatBot Arena 上測試的是誰?這場開源大戰背後,又藏了哪些沒說清楚的眉角🧐?00:00 開頭02:41 Llama 4 發表05:42 實測翻車09:42 測試版不等於開源版?10:50 Meta 為何這麼趕?12:27 LLM 可解釋性的困難14:05 Claude 的思維過程15:20 LLM 有計畫能力17:57 技術細節20:48 為何 LLM 是黑盒?21:25 怎麼打開黑盒?23:34 未來會有可解釋的 LLM?26:13 結論:今天學到什麼?🎧 聽完也歡迎留言告訴我:你覺得語言模型真的「有在思考」嗎?Llama 4 的表現,有讓你失望嗎?🔗 《矽谷輕鬆談》一鍵收聽 ➡️ ⁠https://linktr.ee/jktech

Audio
Featured in this Episode

No persons identified in this episode.

Transcription

This episode hasn't been transcribed yet

Help us prioritize this episode for transcription by upvoting it.

0 upvotes
🗳️ Sign in to Upvote

Popular episodes get transcribed faster

Comments

There are no comments yet.

Please log in to write the first comment.