本期播客深入探讨了OPENAI最新发布的GPT-5及其发布会的形式与内容。讨论者们对发布会的简约风格表示认可,但也对GPT-5的实际表现感到失望,认为其缺乏新意。特别是用户体验方面,很多人觉得新模型在处理复杂问题时的表现不如预期,甚至出现了短期内的负面反馈。尽管如此,GPT-5在记忆功能和编码能力上依然展现出亮眼的技术提升,引发了对其未来发展的期待与疑虑。 【时间线】00:02:00:开放式AI系统:改变发布会形式,打造简单随意的直播风格00:04:49:GPT五:一个统一的AI系统,不仅仅是模型00:09:39:GPT五:基础架构、推理能力与多模态集成的综合分析00:14:31:GPT-6.0:普通用户感受不到的精度和可靠性提升00:19:20:AI学习路径规划:如何选择合适的课程和资源?00:24:08:数学能力与GPT:未来生活的工具还是所有人的必备技能?00:29:01:AI的未来发展趋势:超越幻觉率,探索新的可能性00:33:53:从越南到苹果:如何将人工智能的能力应用于生活中的挑战?00:38:42:AI的未来发展方向:从个人感情到社会影响的思考00:43:30:开源软件的挑战:探索 META 与 Open 草台班子的区别00:48:25:掌控信息的矛盾:何时才能看到人工智能的威力?00:53:13:AI界的黑马:CLOUD公司低调背后的一百亿美金收入奇迹! 【摘要】OpenAI发布会与模型发布解读最近,人工智能领域的大公司如OpenAI发布了新的大模型,但有些人认为其含金量逐渐降低。OpenAI的发布会形式简单随意,没有大场面,但提出了一个新的概念,即GPT-5不仅仅是一个模型,而是一个AI系统。GPT-5根据问题的复杂程度,调用不同的模型进行回答,如GPT-5 thinking模型源自于GPT-4,适用于深度思考的问题。这种根据需求调用不同模型的方式值得关注。GPT-5与普通用户感知的差异GPT-5整合了多种模式,包括简单和复杂问题。在技术方面,GPT-5有优势,如基础架构创新、增强推理能力、多模态集成和编程能力。但在普通用户中,这些优势可能不太明显。GPT-5在2025年美国数学邀请赛中获得了100%的完美分数,显示出强大的问题解决能力。此外,GPT-5还可以实现一些智能体的功能,如与Google邮件、日历等工具整合。然而,对于普通大众来说,这些优势可能难以感知。GPT-5幻觉减少与记忆功能提升讨论了GPT-5在可靠性、准确性和记忆功能方面的优势。GPT-5相较于GPT-4O,错误概率降低了45%,在思考模型模式下降低了80%。幻觉错误率在各个模式下为1%到14%,相较于GPT-4O的10%到20%有所降低。此外,GPT-5的记忆功能得到了显著提升,可以记住更多的数据,方便用户使用。然而,对于普通用户来说,这些改进可能并不明显,需要长期使用才能感受到。AI模型训练与数学竞赛的价值这段内容主要讲述了讲者在训练AI大模型的过程中遇到的问题,以及数学竞赛对于个人能力提升的价值。讲者认为,虽然训练过程很辛苦,但投入的时间并没有得到相应的回报。同时,讲者也提到了数学竞赛的价值,认为数学竞赛可以锻炼人的逻辑推理能力,对于提高智商有很大帮助。此外,数学竞赛还可以作为大模型的基准测试,包括数学、科学与逻辑、通用推理能力等多个方面。最后,讲者强调了数学能力对于很多工作的重要性。大模型发展与数学能力的关系讨论了大模型发展数学能力的重要性,认为即使有了GDP,人们仍然需要高精尖的聪明人。大模型可以解决很多问题,减轻人们的负担,但人们仍需找到自己的天赋和兴趣所在。讲者对大模型的期待并不高,认为它们在日常生活中的应用有限,但对于对话功能表示出兴趣。总的来说,大模型是一种新的尝试,但在操作体验上仍有待提高。AI技术发展与未来展望本次发布会中,幻觉率降低,内容更严谨。提到了一个国外的AI GC榜单,其中GPT-5在编程方向表现优秀。但幻觉率方面,Google的模型只有0.7,相比之下,当前榜单上的模型表现一般。讲者认为,虽然AI技术发展迅速,但革命性的变化并不多,至少在目前看来是这样。对于程序员来说,AI技术的发展速度可能更快,但对于其他行业和工种的影响可能没有那么显著。AI技术应用与期待与失望这段内容主要讨论了人工智能在生活中的应用,以及人们对人工智能发展的期待与失望。虽然人工智能在解决复杂数学题方面取得了进展,但在实际应用中仍面临许多挑战。有些人认为人工智能的发展过于缓慢,甚至可能带来负面影响,如安全合规问题等。另一方面,也有人认为人工智能的发展是循序渐进的,虽然目前的效果可能未达到预期,但仍有值得期待的地方。总之,人工智能在生活中的应用仍面临诸多挑战,需要进一步发展和完善。AI的双面性与语言模型的应用探索这段内容主要讲述了讲者对AI技术的看法。讲者认为AI技术虽然发展迅速,但对于普通人来说,可能并没有太大意义。AI技术可以作为一个辅助工具,提高效率,但对于一些需要深入研究的问题,讲者仍然倾向于自己做调查和研究。同时,讲者也担心AI技术可能会产生虚假信息,因此在使用AI技术时需要保持警惕。总的来说,讲者认为AI技术目前还处于过渡阶段,未来可能会有更大的发展空间。系统安全更新与人才流失的思考这次发布可能只是在使用体验上的小更新,更多的是关于安全性的改进。会议提到了红队测试,但讲者表示自己不太了解。这次更新可能不像苹果手机那样有明显的改变,但操作系统的丝滑度有所提升。另外,会议还讨论了人才流失问题,认为新公司初期可能是草台班子,但随着时间的推移,这些人才可能会转化为生产力。最后,会议提到了GPT-5的安全性升级,认为可能在这次更新中加入了一些安全限制。资本运作与项目发展的探索这段内容主要讨论了Meta公司投资OpenAI的原因,以及OpenAI的发展前景。讲者认为,Meta公司投资OpenAI是因为看到了这个赛道巨大的回报潜力。同时,讲者也提到了其他公司如谷歌、山姆奥特曼等在开源领域的布局。此外,讲者还提到了一个名为Cloud的公司,其收入已经达到100亿美金,并且在融资方面表现出色。讲者认为这个公司非常有趣,值得关注。低调AI公司的发展与应用这段内容主要讲述了一个叫cloud的大模型,讲者认为这个模型非常好用,但并不是一个公司。它的公司名字可能很难发音,很多人都没有听说过。这个公司非常低调,但在旧金山的11个专攻AI的公司中占有一席之地。讲者表示喜欢这种低调的公司,它们的产品默默上线,用户用起来再说。虽然AI大模型在慢慢改变我们的生活,但还没有到革命性的地步,大家还需要继续关注。 欢迎访问Coach8官网:https://jl8.cn 与我们交流
No persons identified in this episode.
This episode hasn't been transcribed yet
Help us prioritize this episode for transcription by upvoting it.
Popular episodes get transcribed faster
Other recent transcribed episodes
Transcribed and ready to explore now
3ª PARTE | 17 DIC 2025 | EL PARTIDAZO DE COPE
01 Jan 1970
El Partidazo de COPE
13:00H | 21 DIC 2025 | Fin de Semana
01 Jan 1970
Fin de Semana
12:00H | 21 DIC 2025 | Fin de Semana
01 Jan 1970
Fin de Semana
10:00H | 21 DIC 2025 | Fin de Semana
01 Jan 1970
Fin de Semana
13:00H | 20 DIC 2025 | Fin de Semana
01 Jan 1970
Fin de Semana
12:00H | 20 DIC 2025 | Fin de Semana
01 Jan 1970
Fin de Semana