web建站教程
     
  1. 首页
  2. 前端UI组件库
  3. AI项目和框架
  4. AIGC工具
  5. 百度echarts
  6. 地图大全
  7. 前端知识
  8. 更多
    vuejs
    js入门
    php入门
    mysql
    wordpress
    织梦cms
    帝国cms
    git教程
    IT知识
    模板大全
    休息站
    AI应用

阿里通义

Mobile-Agent-v3.5模型使用入口,开源多平台GUI Agent框架
Mobile-Agent-v3.5模型使用入口,开源多平台GUI Agent框架

Mobile-Agent-v3.5在OSWorld-Verified、AndroidWorld、VisualWebArena等20+主流GUI基准测试中斩获开源领域SOTA性能,凭借混合数据飞轮、统一思维链合成、MRPO多平台强化学习三大核心技术,有效解决跨平台动作空间不一致、长程任务训练不稳定等行业痛点,为社区提供从基座模型到Agent框架的完整开源技术方案。

GUI Agent框架阿里通义
Fun-CosyVoice3.5语音生成模型,支持13种语言,可精准调节语气、语速、语调、情绪
Fun-CosyVoice3.5语音生成模型,支持13种语言,可精准调节语气、语速、语调、情绪

Fun-CosyVoice3.5是阿里通义实验室语音团队全新推出的新一代语音生成模型,模型首创FreeStyle口语化指令控制,无需专业参数,只需用自然语言描述即可精准调节语气、语速、语调、情绪;同时支持13种语言,发音准确率与生成延迟全面优化,是面向实时交互、内容创作、多语言出海的工业化级语音方案。

语音生成模型通义实验室阿里通义
Fun-AudioGen-VD模型使用入口,专注于专业声音设计与场景化音频生成
Fun-AudioGen-VD模型使用入口,专注于专业声音设计与场景化音频生成

Fun-AudioGen-VD是阿里通义实验室语音团队自研的新一代语音生成大模型,专注于专业声音设计与场景化音频生成。模型支持自然语言FreeStyle自由指令生成,可一次性输出包含指定音色、情感、环境、空间、设备质感的完整音频。

通义实验室阿里通义音色设计模型AI
Qwen3.5模型使用入口,开源版本Qwen3.5-397B-A17B采用创新混合架构
Qwen3.5模型使用入口,开源版本Qwen3.5-397B-A17B采用创新混合架构

Qwen3.5通过早期文本-视觉融合、M-RoPE及3D位置编码技术,统一支持文本、图像、视频多任务处理,语言覆盖从119种扩展至201种。权威评测中表现顶尖:MMLU-Pro得分87.8超越GPT-5.2,GPQA得分88.4高于Claude 4.5,IFBench指令遵循评分76.5刷新行业纪录。

多模态AI模型通义千问阿里通义
CoPAW官网使用入口,阿里云通义实验室个人智能体工作台,你的专属数字搭档
CoPAW官网使用入口,阿里云通义实验室个人智能体工作台,你的专属数字搭档

CoPaw是阿里云通义实验室重磅推出的个人智能体工作台,平台内置文档处理、新闻阅读、浏览器操作等多种基础能力(Skills),同时支持自定义Skill轻松扩展功能边界,无需修改底层代码。

AI智能体工作台对话交互AI阿里通义
Qwen-Image-2.0模型官网使用入口,新一代多模态图像生成基础模型
Qwen-Image-2.0模型官网使用入口,新一代多模态图像生成基础模型

Qwen-Image-2.0是阿里通义千问推出的新一代多模态图像生成基础模型,主打精准文字渲染与细腻真实质感两大核心能力。支持1K token长指令直出专业信息图、PPT、海报,原生2K高清输出,人物、自然、建筑细节表现力拉满。

AI图像生成大模型智能基础模型通义千问阿里通义
当贝AI智能助手,整合DeepSeek、豆包、通义等多款优质大模型
当贝AI智能助手,整合DeepSeek、豆包、通义等多款优质大模型

当贝AI是当贝公司自主研发的智能助手产品,深度整合DeepSeek-R1 671B满血版、DeepSeek V3、豆包、通义等多款优质大模型,为用户提供免费免登录、极速响应、不限量使用的全场景大模型服务,一站式满足各类智能交互与内容创作需求。

AI写作助手AI文案写作AI文献助手DeepSeek-R1豆包大模型阿里通义
视觉工程|爱聚合:集成了多种前沿AI图像和视频生成工具
视觉工程|爱聚合:集成了多种前沿AI图像和视频生成工具

爱聚合是一个AI视觉内容创作聚合平台,集成了多种前沿AI图像和视频生成工具,为用户提供一站式的AI创作服务。平台整合了OpenAI Sora、Google Veo 3、Grok、阿里通义万象等多个主流AI模型,支持从图片生成到视频制作的完整创作流程。

AI视觉内容创作Google VeoGrokOpenAISora阿里通义
Qwen3-ASR:阿里云通义千问团队开源的语音识别模型系列
Qwen3-ASR:阿里云通义千问团队开源的语音识别模型系列

Qwen3-ASR是阿里云通义千问团队开源的语音识别模型系列,模型支持52个语种与方言识别、流式/非流式一体化推理,在强噪声、快语速、歌唱等复杂场景下表现稳定鲁棒——1.7B模型在中英文及方言识别领域达开源SOTA水平,0.6B模型可支持128并发、2000倍吞吐,10秒即可处理5小时音频,兼顾精度与效率需求。

Qwen3基础架构语音识别模型阿里通义
Qwen3-Max-Thinking:阿里千问系列全新推出的旗舰级推理大模型

Qwen3-Max-Thinking模型大幅强化原生Agent能力,可自适应自主调用工具,输出更智能、流畅且精准的回答。目前开发者与普通用户可通过Qwen Chat、千问PC端及网页端免费体验,企业可通过阿里云百炼获取专属API服务,千问APP也即将完成新模型接入。

AI推理模型通义千问阿里通义
Qwen3-TTS:阿里通义Qwen开源的系列语音生成模型
Qwen3-TTS:阿里通义Qwen开源的系列语音生成模型

Qwen3-TTS是Qwen开源的系列语音生成模型,该模型基于自研的Qwen3-TTS-Tokenizer-12Hz多码本语音编码器,搭配Dual-Track双轨建模技术,实现高效语音压缩与极速生成;支持10种主流语言及多种方言,具备智能文本语义理解能力,可自适应调控语音的语气、节奏与情感。

AI音色定制GitHub仓库语音生成模型阿里通义
QwenLong-L1.5:阿里通义实验室推出的长文本推理大语言模型
QwenLong-L1.5:阿里通义实验室推出的长文本推理大语言模型

QwenLong-L1.5是阿里通义实验室推出的长文本推理专用大语言模型,基于Qwen3-30B-A3B架构打造。通过系统化后训练方案,结合高质量数据合成管线、稳定强化学习方法与突破物理窗口限制的记忆管理框架。

GitHub仓库长文本推理模型阿里通义
Z-Image:阿里通义6B参数轻量化多模态图像生成模型
Z-Image:阿里通义6B参数轻量化多模态图像生成模型

Z-Image是阿里通义推出的6B参数轻量化图像生成模型,构建单流DiT架构核心底座,衍生出三大功能变体:Z-Image-Turbo、Z-Image-Base、Z-Image-Edit,精准匹配不同场景需求。

AI图像生成模型阿里通义
WebResearcher:隶属通义DeepResearch家族,阿里通义迭代式深度研究智能体
WebResearcher:隶属通义DeepResearch家族,阿里通义迭代式深度研究智能体

WebResearcher作为阿里巴巴通义实验室重磅推出的迭代式深度研究智能体,精准模拟人类专家的认知工作流程。它具备自主拆解复杂问题、智能协调工具调用、整合碎片化信息输出有理有据报告的核心能力,与传统研究智能体相比,通过分阶段处理研究全流程。

Agent框架智能体模型阿里通义
WebWeaver:阿里通义双智能体研究框架,重塑开放性深度研究新范式
WebWeaver:阿里通义双智能体研究框架,重塑开放性深度研究新范式

WebWeaver的核心突破在于动态大纲优化机制——将研究大纲视为可实时更新的“活文档”,在全网信息检索与大纲细化完善之间构建循环链路,让研究方向随新发现动态演变,确保研究深度与前沿性。

Agent框架阿里通义
Trae:新一代免费的AI编程工具