web建站教程
     
  1. 首页
  2. 前端UI组件库
  3. AI项目和框架
  4. AIGC工具
  5. 百度echarts
  6. 地图大全
  7. 前端知识
  8. 更多
    vuejs
    js入门
    php入门
    mysql
    wordpress
    织梦cms
    帝国cms
    git教程
    IT知识
    模板大全
    休息站
    AI应用

语音生成模型

Fun-CosyVoice3.5语音生成模型,支持13种语言,可精准调节语气、语速、语调、情绪
Fun-CosyVoice3.5语音生成模型,支持13种语言,可精准调节语气、语速、语调、情绪

Fun-CosyVoice3.5是阿里通义实验室语音团队全新推出的新一代语音生成模型,模型首创FreeStyle口语化指令控制,无需专业参数,只需用自然语言描述即可精准调节语气、语速、语调、情绪;同时支持13种语言,发音准确率与生成延迟全面优化,是面向实时交互、内容创作、多语言出海的工业化级语音方案。

语音生成模型通义实验室阿里通义
Qwen3-TTS:阿里通义Qwen开源的系列语音生成模型
Qwen3-TTS:阿里通义Qwen开源的系列语音生成模型

Qwen3-TTS是Qwen开源的系列语音生成模型,该模型基于自研的Qwen3-TTS-Tokenizer-12Hz多码本语音编码器,搭配Dual-Track双轨建模技术,实现高效语音压缩与极速生成;支持10种主流语言及多种方言,具备智能文本语义理解能力,可自适应调控语音的语气、节奏与情感。

AI音色定制GitHub仓库语音生成模型阿里通义
VoxCPM:0.5B轻量语音生成模型,重塑高保真实时语音合成体验
VoxCPM:0.5B轻量语音生成模型,重塑高保真实时语音合成体验

VoxCPM支持零样本声音克隆,仅需一段参考音频,即可精准复刻说话者的音色、口音、情感语调等细微特征,生成高度逼真的个性化语音。其推理效率同样表现卓越,在NVIDIA RTX 4090 GPU上实时因子(RTF)低至0.17,完美满足实时交互场景需求。

GitHub仓库清华大学语音生成模型面壁智能
Trae:新一代免费的AI编程工具