
Qwen-Image-2.0是阿里通义千问推出的新一代多模态图像生成基础模型,主打精准文字渲染与细腻真实质感两大核心能力。支持1K token长指令直出专业信息图、PPT、海报,原生2K高清输出,人物、自然、建筑细节表现力拉满。

SAIL-Embedding是由字节跳动抖音SAIL团队与香港中文大学MMLab联合研发的全模态嵌入基础模型,该模型支持文本、视觉、音频等任意模态输入,可生成统一且高信息量的特征表示,赋能多模态检索、分类、推荐等核心任务。

Spirit-v1.5是千寻智能研发的新一代具身智能基础模型,开创性采用多样化、开放式数据采集方案,打破传统“干净数据”的局限,让模型在预训练阶段接触海量多元的动作场景与任务流程,具备卓越的泛化能力与环境适应性。
