Menu
Sign In Search Podcasts Charts People & Topics Add Podcast API Pricing
Podcast Image

科技報橘

【全新一週】DeepSeek 引爆全球 AI 開源/閉源大戰,Edge AI App 時代來臨!簡立峰:任何因為 AI 而在終端裡頭加速的東西,都會受益│EP149

15 Feb 2025

Description

📢本集來賓: ✨簡立峰/Google 台灣前董事總經理 📢收聽這集,你可以得知: 一、認識 DeepSeek  ✨如何看 DeepSeek 這個模型? ✨DeepSeek 真的是開源嗎?Open Source、Open Weights,它開放哪些? ✨DeepSeek 有什麼是沒有開放給大家檢視的?為什麼?別的開源也是這樣嗎? ✨DeepSeek 有分成「開源版」跟「線上服務版」,有什麼不同? ✨為什麼即使是開源的版本,都不見得代表 100% 安全? ✨為什麼 DeepSeek 問世,是讓 AI 的發展再平衡,讓 AI 產業邁向多元化? 二、DeepSeek 對台灣的影響 ✨怎麼從 DeepSeek 看台灣主權模型和基礎建設? ✨為什麼 DeepSeek 問世會帶來硬體產業的改變?台灣受惠的產業會有哪些? ✨從 AI PC、AI Phone 到 ASIC 的晶片加速器,為什麼任何因為 AI 而在終端裡頭加速的東西,都會受益? ✨從雲端業者到 Edge AI,必須掌握哪些產業機會? ✨為什麼 DeepSeek 問世,NVIDIA 股價跌得比較多,台積電跌得比較少? ✨以前說台灣沒算力、沒數據、不具 AI 軟體產業優勢,現在 DeepSeek 證明了不需要基礎模型,台灣軟體產業有什麼改變的契機? ✨為什麼軟體產業在這波要領先的關鍵,是掌握 Edge AI 的 App? 三、DeepSeek 爭議&言論審查 ✨開源社群很多人在努力,想試圖關掉言論審查的部分,做得到嗎? ✨如何從「權重參數」和「內容過濾」兩個部分,來看 DeepSeek 的言論審查? 四、開源的競爭 ✨同樣是開源,為什麼是 LLaMA 把步調變慢,而不是 DeepSeek 追上了? ✨LLaMA 的研發步調為什麼不快?是為了要讓開發者熟悉?還是因為訓練成本高昂? ✨DeepSeek 如今問世,對 LLaMA 的影響會是什麼? ✨LLaMA 會被迫要加速嗎?會導致 Training Cost 提升嗎? 五、推理模型 ✨推理模型跟大型語言模型有什麼不一樣? ✨哪些問題適合用推理、哪些適合用大型語言模型? ✨為什麼推理模型可以讓模型的穩定度上升? ✨為什麼推理模型使用起來比較慢? 六、AGI (Artificial General Intelligence) ✨AGI 是什麼?分成哪幾個 Level?未來想要發展到什麼階段? ✨聊天機器人用的大型語言模型是哪一級?推理模型是哪一級?正在大力發展的 AI Agent,又屬於哪個層級? ✨DeepMind 的 CEO Demis Hassabis 說 AGI 五年內問世,如何看 AGI 的發展趨勢? ✨為什麼 AI 解決問題的層級會不斷改變,從被動導向主動? ------------------- 🔆科技報橘|https://buzzorange.com/techorange/ 🟠Facebook|https://www.facebook.com/TechOrange/ 🔆LinkedIn|https://tw.linkedin.com/showcase/techorange 🟠Line|https://page.line.me/vvx9094k?openQrModal=true 🔆YouTube|https://www.youtube.com/channel/UCs-pAaEq43d3ghKpmIx-Fnw -- Hosting provided by SoundOn

Audio
Featured in this Episode

No persons identified in this episode.

Transcription

This episode hasn't been transcribed yet

Help us prioritize this episode for transcription by upvoting it.

0 upvotes
🗳️ Sign in to Upvote

Popular episodes get transcribed faster

Comments

There are no comments yet.

Please log in to write the first comment.