小米开源 OmniVoice,覆盖 600+ 语种的语音克隆 TTS
来自:www.oschina.net 收录时间:2026-04-09
小米 AI 实验室新一代 Kaldi 团队(k2-fsa)已推出了 OmniVoice,一款能覆盖 600+ 语种的语音克隆 TTS 模型。目前,OmniVoice 的训练、推理代码以及模型权重已全部开源。 OmniVoice 核心优势有三点: 极简的超强架构:OmniVoice 是现有非自回归 TTS 模型中最简单的,且合成语音质量最好,同时还具有训练和推理速度上的巨...
阅读更多