AI Podcast

流媒体Sortformer：基于到达顺序的说话人缓存实时说话人识别

23 Aug 2025

Audio

Description

本期节目深入探讨了NVIDIA最新发布的“流媒体Sortformer”技术，这是一种基于说话人到达时间顺序的实时说话人识别框架。我们将详细解析其核心创新——“到达顺序说话人缓存”（AOSC），以及它如何突破传统离线方法的局限，实现高效、低延迟的实时多说话人追踪。从Sortformer的诞生到流媒体扩展的精妙设计，再到在DIHARD III和CALLHOME等基准数据集上的卓越表现，我们将为您揭示这一技术如何为实时字幕、虚拟会议和对话分析等应用带来革命性变革。

Transcription

This episode hasn't been transcribed yet

Help us prioritize this episode for transcription by upvoting it.

0 upvotes

🗳️ Sign in to Upvote

Popular episodes get transcribed faster

Other recent transcribed episodes

Transcribed and ready to explore now

13:00H | 21 DIC 2025 | Fin de Semana

01 Jan 1970

Fin de Semana

10:00H | 21 DIC 2025 | Fin de Semana

01 Jan 1970

Fin de Semana

12:00H | 20 DIC 2025 | Fin de Semana

01 Jan 1970

Fin de Semana

2ª PARTE | 06 ENE 2026 | EL PARTIDAZO DE COPE

01 Jan 1970

El Partidazo de COPE

3ª PARTE | 22 ENE 2026 | EL PARTIDAZO DE COPE

01 Jan 1970

El Partidazo de COPE

3ª PARTE | 04 MAR 2026 | EL PARTIDAZO DE COPE

01 Jan 1970

El Partidazo de COPE

Comments

There are no comments yet.

Please log in to write the first comment.

Report any issue

AI Podcast

流媒体Sortformer：基于到达顺序的说话人缓存实时说话人识别

This episode hasn't been transcribed yet

Other recent transcribed episodes

13:00H | 21 DIC 2025 | Fin de Semana

10:00H | 21 DIC 2025 | Fin de Semana

12:00H | 20 DIC 2025 | Fin de Semana

2ª PARTE | 06 ENE 2026 | EL PARTIDAZO DE COPE

3ª PARTE | 22 ENE 2026 | EL PARTIDAZO DE COPE

3ª PARTE | 04 MAR 2026 | EL PARTIDAZO DE COPE

Sign in to Audioscrape

Share this moment