AI工作站

官方网址：https://ai.aliyun.com/nls/tts

通过先进的深度学习技术，将文本转换成自然流畅的语音。高拟真度、灵活配置的语音合成产品，打通人机交互的闭环，让应用逼真发声。多种音色可供选择，并提供调节语速、语调、音量等功能。适用于智能客服、语音交互、文学有声阅读和无障碍播报等场景。

阿里云TTS的功能

1、Knowledge-Aware Neural TTS （KAN-TTS）

语音合成技术将文本转化为语音，将神经网络与领域知识双重结合，兼具读音准确，韵律自然，声音还原度高，表现力强的特点。

2、支持多语种方言及中英混合播报

目前支持日语及多种东南亚语种，粤语、天津、湖南、东北等方言，多个声音模型支持中英混合播报。

3、支持字级别时间戳

可用于视频配音中的音频与字幕时间对齐，虚拟形象口型对齐等。

4、可快速进行动态参数调整

支持动态调整发音人、语速、音量、语调、采样率、多种音频编码格式等；支持SSML标签语言；支持流式合成，边合成边播放。

阿里云TTS的优势

1、技术先进

技术上兼顾了多级韵律停顿，达到自然合成韵律的目的，综合利用声学参数和语言学参数，建立基于深度学习的多重自动预测模型。

2、多领域覆盖

在智能家居、车载、导航、金融、银行、保险、证券、运营商、物流、房地产、教育等众多领域积累了大量的词库，让阿里云语音合成在各领域、各行业的词汇发音更准确。

3、听感自然

使用海量的音频数据训练发音模型，合成音真实饱满、抑扬顿挫、富有表现力，MOS评分达到业内专业水准。

4、丰富音库

拥有丰富的音色库，提供约110个音色，更有标准男女声，温柔甜美女声等多种风格可供选择，支持标记语言（SSML）合成方式，情感、音量、语速、音高等参数也支持动态调整。