← 返回模型库

通义多模态向量-Flash

提供方:阿里云百炼

Tongyi-Embedding-Vision是基于LLM底座的视觉多模态表征模型,支持文本、图像、视频3种模态,具有以视觉为中心、全场景性能优异、高性价比的特点,适用于以图搜图、以文搜图、以文搜视频、以视频搜视频、以文搜文、以文搜图文等下游多样化任务场景。本模型(tongyi-embedding-vision-flash)是轻量化版本,具备极高性价比。 2026-03-06版本在保留极致性价比优势的同时,基于Qwen3底座实现了效果与功能全面升级,包括全场景性能提升、多分辨率模式/多向量维度/多语言能力/融合向量等能力的支持。

LMSYS Elo
-
热度指数
0

分类

通用

发布时间

2026/3/21