技术文摘 - 程序员工具箱

阿里通义实验室发布端到端语音识别大模型 FunAudio-ASR

来自：www.oschina.net 收录时间：2025-09-16

阿里巴巴通义实验室发布了其端到端语音识别大模型 FunAudio-ASR。该模型通过创新的 Context 模块，成功将高噪声场景下的幻觉率从 78.5% 大幅降低至 10.7%，降幅接近 70%。模型使用了数千万小时的音频数据进行训练，并融合了大语言模型的语义能力，在远场、嘈杂、多说话人等复杂条件下，其性能已超越 Seed-ASR、KimiAud...

阅读更多