← 返回模型库
阿
Qwen3-Omni-Flash-Realtime
提供方:阿里云百炼
千问3-Omni-Flash多模态大模型的实时版,基于Thinker–Talker混合专家(MoE)架构,支持文本、图像、音频、视频的高效理解与语音生成能力,可进行119种语言文本交互和20种语言语音交互,支持49种语音音色,生成类人语音实现跨语言精准沟通。模型具备强大指令跟随与系统提示定制功能,灵活适配对话风格与角色设定,广泛应用于文本创作、语音助手、多媒体分析等场景,提供自然流畅的多模态交互体验。此版本为2025年12月01日的快照版本。
LMSYS Elo
-
热度指数
0