整整4年前,计算机视觉领域专家孙晨首次做客节目,介绍了计算机视觉领域的发展。如今,他再次做客,详细讨论了大语言模型对计算机视觉带来的巨大冲击与新机遇,并回顾了过去4年的显著变化。他提到生成式模型的崛起,使图像和视频生成技术取得了突破性进展,以及扩散模型在生成高保真度图像中的应用。孙教授分享了他的研究成果,包括一个用于测试模型在新环境中表现的宇航员测试集。他还探讨了大语言模型在医学、教育等领域的广泛应用和未来趋势,强调了工程能力在该领域的重要性,并提出了未来发展的挑战与机遇。 嘉宾:孙晨 主播:斯图亚特、Vindy 剪辑&时间线:季雨清 00:01:53 学校做科研和企业做研究的区别 00:09:39 短短4年,做菜视频生成菜谱的理想已经实现 00:19:34 学术界寻找自我 00:22:37 计算机视觉的最新进展 00:29:01 AI具备“理解”能力吗 00:37:16 给AI打工 00:44:41 计算机视觉的可能未来 00:51:24 如何进入计算机视觉领域 欢迎您在每期节目下方给我们留言,和我们的主播互动交流。如果您对我们的志愿者工作有兴趣,请点击 这个链接 看我们的招募帖;你有什么有趣的话题,想来作牛油果烤面包的嘉宾,或是对节目有任何的意见或建议,欢迎发邮件和我们联系。我们的邮件地址是:[email protected] 片头片尾音乐: Courante 1st Cello Suite Exzel Music Publishing (freemusicpublicdomain.com) Licensed under Creative Commons: By Attribution 3.0 http://creativecommons.org/licenses/by/3.0/
No persons identified in this episode.
This episode hasn't been transcribed yet
Help us prioritize this episode for transcription by upvoting it.
Popular episodes get transcribed faster
Other recent transcribed episodes
Transcribed and ready to explore now
Before the Crisis: How You and Your Relatives Can Prepare for Financial Caregiving
06 Dec 2025
Motley Fool Money
OpenAI's Code Red, Sacks vs New York Times, New Poverty Line?
06 Dec 2025
All-In with Chamath, Jason, Sacks & Friedberg
OpenAI's Code Red, Sacks vs New York Times, New Poverty Line?
06 Dec 2025
All-In with Chamath, Jason, Sacks & Friedberg
Anthropic Finds AI Answers with Interviewer
05 Dec 2025
The Daily AI Show
#2423 - John Cena
05 Dec 2025
The Joe Rogan Experience
Warehouse to wellness: Bob Mauch on modern pharmaceutical distribution
05 Dec 2025
McKinsey on Healthcare