Menu
Sign In Search Podcasts Charts People & Topics Add Podcast API Pricing
Podcast Image

矽谷輕鬆談 Just Kidding Tech

S2E20 最聰明 AI 誕生:Grok 4 靠巨量 RL 打爆人類最終測驗

13 Jul 2025

Description

全球最聰明的 AI 誕生了,而且它不是 GPT。xAI 推出的 Grok 4,在最新的 AI 大魔王考試裡,不只全場最高分,甚至學會了怎麼自己叫工具、自己算數學、還自己訂貨賣東西,靠經營虛擬販賣機賺了 4694 美金,撐了 324 天不崩潰。它的祕密武器叫做——巨量強化學習。這集我們就來聊聊:📌 Grok 4 的架構到底哪裡跟別人不一樣?📌 強化學習不是拿來下圍棋的嗎?怎麼變成新的 pretraining?📌 人類最終測驗是什麼?為什麼它比你所有面試都難一百倍?📌 Vending-Bench 是什麼鬼?為什麼可以逼瘋大模型?📌 Grok Heavy 值不值得每月 300 美金?📌 如果每個 AI 都能考滿分,下一步是什麼?🎧 喜歡最前線的 AI 訓練技術、尖端模型設計與超酷 benchmark,這集你一定會聽得超過癮。🔗 《矽谷輕鬆談》傳送門 ➡️ https://linktr.ee/jktech(00:00) 開頭(00:58) 說走就走的旅行來去 Minneapolis(04:35) 愛情來得太快就像龍捲風(08:21) Grok 4 登場拿下最聰明 AI 寶座(10:30) 人類最終測驗到底有多難?(12:47) 為什麼 Benchmark 越來越不重要?(14:12) Grok 4 vs Heavy 版到底差在哪?(15:51) 巨量強化學習:訓練方式的大突破(19:04) RL 是新的預訓練?效果到底有多猛?(20:48) Grok 的語音模型:生動、即時、很會演(22:02) ARC-AGI 測驗:人類秒解,AI 煩死(23:45) Grok 經營虛擬販賣機 324 天賺爆(26:03) Grok 的強項與罩門:推理很強,但日常還是 GPT?(27:34) 我對 AI 的未來想像:內容自動化個人化 + 科學突破

Audio
Featured in this Episode

No persons identified in this episode.

Transcription

This episode hasn't been transcribed yet

Help us prioritize this episode for transcription by upvoting it.

0 upvotes
🗳️ Sign in to Upvote

Popular episodes get transcribed faster

Comments

There are no comments yet.

Please log in to write the first comment.