
Qwen3-Omni支持119种语言文本交互、19种语音理解语言及10种语音生成语言,轻松覆盖全球主流语种,满足跨地域业务需求。响应速度更实现突破性优化,纯模型端到端音频对话延迟低至211ms,视频对话延迟低至507ms,搭配长达30分钟的长音频理解能力,为实时交互场景提供流畅体验。

Qwen3-TTS-Flash在语音自然度上实现跨越式升级。通过智能语速韵律调节技术,合成语音能够精准还原真人表达的情绪起伏与语言节奏——无论是娓娓道来的知识讲解,还是情绪饱满的剧情配音,都能传递出细腻的“人味”,彻底告别机械感。

Qwen3Guard的项目地址 项目官网:

最新推出的Qwen3-Max Thinking是阿里的推理版AI模型,基于万亿参数的MoE架构,专门用在复杂问题的推理和思考。Qwen3-Max Thinking在数学竞赛、代码挑战等任务中表现优异,部分成绩超越国际主流模型如Claude Opus 4。

Qwen3-LiveTranslate是阿里通义团队研发的大语言模型驱动型多语言实时音视频同传系统,支持18种主流语言及多地方言的精准翻译,创新性融合视觉增强技术,通过捕捉口型、动作等多模态信息,大幅提升复杂场景下的翻译准确性。
Qwen3-VL-Reranker是阿里通义基于 Qwen3-VL 架构打造的跨模态理解模型,专为多模态信息检索场景设计。模型可接收任意模态组合的查询与文档对(如图文查询匹配图文文档),通过单塔架构与交叉注意力机制深度解析语义关联,输出精准
Qwen3-VL-Embedding是阿里通义推出的多模态信息检索模型,专为文本、图像、可视化文档(图表 / 代码 / UI 组件等)、视频等多模态输入场景设计。
