阿里通义实验室发布端到端语音识别大模型 FunAudio-ASR
来自:www.oschina.net 收录时间:2025-09-16
阿里巴巴通义实验室发布了其端到端语音识别大模型 FunAudio-ASR。该模型通过创新的 Context 模块,成功将高噪声场景下的幻觉率从 78.5% 大幅降低至 10.7%,降幅接近 70%。 模型使用了数千万小时的音频数据进行训练,并融合了大语言模型的语义能力,在远场、嘈杂、多说话人等复杂条件下,其性能已超越 Seed-ASR、KimiAud...
阅读更多