web建站教程
     
  1. 首页
  2. 前端UI组件库
  3. AI项目和框架
  4. 前端知识
  5. AI应用
  6. IT知识
  7. ComfyUI插件
  8. 地图大全
  9. 休息站

文本转语音模型

小米OmniVoice官网 - 小米K2-Fsa重磅TTS模型,600+语言+极速克隆
小米OmniVoice官网 - 小米K2-Fsa重磅TTS模型,600+语言+极速克隆

OmniVoice是小米K2-Fsa团队推出的新一代文本转语音(TTS)模型,以扩散语言模型架构打破传统语音合成壁垒,支持600+语言与方言,兼具业界顶尖零样本声音克隆、极速推理与文本定制音色能力。

K2-Fsa团队TTS模型小米开源AI文本转语音模型
豆包网页版支持AI聊天,AI图片生成,AI漫画生成,AI写作等
[推荐] 豆包网页版:支持AI聊天,AI图片生成,AI漫画生成,AI写作等

字节跳动开发的一款多功能人工智能工具,基于云雀模型(豆包大模型)构建。它不仅是一个AI聊天机器人,还具备多种功能,包括写作助手、英语学习助手、音乐生成、编程助理等。

AI写作平台AI图片生成AI漫画生成工具AI聊天助手
ComfyUI-Qwen-TTS插件安装入口,一站式文本转语音、声音克隆、声音风格设计与多角色对话合成
ComfyUI-Qwen-TTS插件安装入口,一站式文本转语音、声音克隆、声音风格设计与多角色对话合成

ComfyUI-Qwen-TTS是基于阿里巴巴Qwen团队开源项目Qwen3-TTS打造的ComfyUI专用自定义节点集,为ComfyUI提供一站式文本转语音、声音克隆、声音风格设计与多角色对话合成能力,支持高质量、低延迟、多语言的端到端语音生成,可直接嵌入图像/视频工作流使用。

AI声音克隆ComfyUI安装ComfyUI语音Qwen3-TTS文本转语音模型
KaniTTS2模型使用入口,NineNineSix正式开源的新一代TTS模型
KaniTTS2模型使用入口,NineNineSix正式开源的新一代TTS模型

KaniTTS2是AI初创公司NineNineSix正式开源的新一代文本转语音(TTS)模型,专为低延迟、高自然度的实时对话场景量身打造。该模型支持语音克隆、多语言输出,同时提供完整的从零预训练代码框架,助力开发者基于自有数据快速训练定制化TTS模型。

NineNineSixTTS模型文本转语音模型
Qwen3-TTS-Flash:开源语音合成模型,49种音色+10种语言+9种方言
Qwen3-TTS-Flash:开源语音合成模型,49种音色+10种语言+9种方言

Qwen3-TTS-Flash在语音自然度上实现跨越式升级。通过智能语速韵律调节技术,合成语音能够精准还原真人表达的情绪起伏与语言节奏——无论是娓娓道来的知识讲解,还是情绪饱满的剧情配音,都能传递出细腻的“人味”,彻底告别机械感。

Qwen3基础架构文本转语音模型阿里通义
扣子空间 – 免费全能AI办公智能体
Trae:新一代免费的AI编程工具