AI Podcast

ESPnet-SpeechLM：解密开源语音语言模型工具包

30 Jul 2025

Audio

Description

本期播客深入探讨了ESPnet-SpeechLM，这是一个旨在简化和普及语音语言模型（SpeechLMs）开发的开源工具包。我们讨论了它如何将自动语音识别（ASR）、文本到语音转换（TTS）等多种语音任务统一为通用的序列建模问题，并详细介绍了其从数据预处理到模型训练、推理和评估的完整工作流程。通过具体的用例，我们展示了该工具包构建高性能、多任务语音大模型的强大能力，包括一个在多项基准测试中表现出色的17亿参数模型。

Transcription

This episode hasn't been transcribed yet

Help us prioritize this episode for transcription by upvoting it.

0 upvotes

🗳️ Sign in to Upvote

Popular episodes get transcribed faster

Other recent transcribed episodes

Transcribed and ready to explore now

13:00H | 21 DIC 2025 | Fin de Semana

01 Jan 1970

Fin de Semana

10:00H | 21 DIC 2025 | Fin de Semana

01 Jan 1970

Fin de Semana

12:00H | 20 DIC 2025 | Fin de Semana

01 Jan 1970

Fin de Semana

2ª PARTE | 06 ENE 2026 | EL PARTIDAZO DE COPE

01 Jan 1970

El Partidazo de COPE

3ª PARTE | 22 ENE 2026 | EL PARTIDAZO DE COPE

01 Jan 1970

El Partidazo de COPE

3ª PARTE | 04 MAR 2026 | EL PARTIDAZO DE COPE

01 Jan 1970

El Partidazo de COPE

Comments

There are no comments yet.

Please log in to write the first comment.

Report any issue

AI Podcast

ESPnet-SpeechLM：解密开源语音语言模型工具包

This episode hasn't been transcribed yet

Other recent transcribed episodes

13:00H | 21 DIC 2025 | Fin de Semana

10:00H | 21 DIC 2025 | Fin de Semana

12:00H | 20 DIC 2025 | Fin de Semana

2ª PARTE | 06 ENE 2026 | EL PARTIDAZO DE COPE

3ª PARTE | 22 ENE 2026 | EL PARTIDAZO DE COPE

3ª PARTE | 04 MAR 2026 | EL PARTIDAZO DE COPE

Sign in to Audioscrape

Share this moment