适逢Sora2问世不到一个月,我快速地尝试了使用Sora2“搓” 了100多个视频,分享一些所思所想给大家,文末放了邀请码,欢迎一起来玩。节目时间线:00:00 欢迎与开场:Sora 2 远超预期的使用体验与低失败率02:00 限制性研究:探索 Sora 2 在资讯内容生成中的限制和失败案例02:40 限制点1:规避知名的公众人物和名人03:30 限制点2:国际政治话题被限制04:00 限制点3, 4:未经授权的“共创”内容及涉及儿童的不安全因素05:00 Sora 2 高点赞视频类型分析:体育赛事赛点、温馨场景06:45 高赞视频类型(续):数字虚拟人主播(上半身动作可控)与电影极致质感的自然环境报道(如沙漠、宇宙)08:30 视频生成流程:需邀请码、使用大模型完善 Prompt(构图、节奏、角色、背景音乐)与每日生产限额(最多30个视频)10:30 视角对比:国内(中国)对广告和日常 Vlog(如爬金字塔、冲浪)效果的积极评价与内容局限12:50 视角对比:海外(Reddit)的负面声音——不符**物理规律**的挑战(如滑板技法错误、双马物理)15:00 国际担忧:“失控感”(Out of Control)与无法辨别 AI 视频真伪的焦虑17:00 法律与社会应用担忧:在抚养权案件或政治选举中滥用 AI 视频的风险19:30 个人总结与未来思考:从业者的谨慎乐观态度、监管难度(AI 内容标识)与技术发展的未知性21:50 核心探讨:大型公司发展视觉生成的终极目标——通过视觉落地(Visual Grounding)提升文本理解力22:30 Visual Grounding 对文本理解的三大积极影响:深入理解(具象化)、模仿人类学习模式(基于物理世界感知)及技能转移💡Sora2邀请码:8G5MJH (再次感谢秋芝2046的介绍和分享 她的Youtube channel)💡论文:Vokenization: Improving Language Understanding with Contextualized, Visual-Grounded Supervision 论文地址 论文讲解封面图片:Sora2生成视频截图播客背景音乐:科幻主题风格的音乐 Zager & Evans - In the Year 2525 Youtube link节目时间线由NotebookLM辅助生成记得点赞收藏和分享我的播客呀
No persons identified in this episode.
This episode hasn't been transcribed yet
Help us prioritize this episode for transcription by upvoting it.
Popular episodes get transcribed faster
Other recent transcribed episodes
Transcribed and ready to explore now
Trump $82 Million Bond Spree, Brazil Tariffs 'Too High,' More
16 Nov 2025
Bloomberg News Now
Ex-Fed Gov Resigned After Rules Violations, Trump Buys $82 Mil of Bonds, More
16 Nov 2025
Bloomberg News Now
THIS TRUMP INTERVIEW WAS INSANE!
16 Nov 2025
HasanAbi
Epstein Emails and Trump's Alleged Involvement
15 Nov 2025
Conspiracy Theories Exploring The Unseen
New Epstein Emails Directly Implicate Trump - H3 Show #211
15 Nov 2025
H3 Podcast
Trump Humiliates Himself on FOX as They Call Him Out
15 Nov 2025
IHIP News