← 返回模型库

Fun-ASR实时语音识别

提供方:阿里云百炼

通义实验室新一代端到端语音识别大模型的实时版,基于领先的自研语音技术,具备卓越的上下文感知和高精度语音转写能力。基于端到端架构,Fun-ASR 集成了创新的 RAG 技术,支持大规模热词自定义、敏感/语气词自动过滤、ITN 规范化、标点预测等多维功能,显著提升了整体识别准确率和语境贴合度。同时,Fun-ASR 支持中英文自由切换,多地区方言覆盖,具备更强的噪声鲁棒性,适应多样复杂环境。此版本为2025年9月15日的快照版本。

LMSYS Elo
-
热度指数
0

分类

通用

发布时间

2025/9/24