
SoulX-Singer是工业级零样本歌声合成模型,核心优势为零样本克隆、双模式控制、跨语言合成,性能领先开源方案;技术层面依托Flow Matching架构、显式多模态对齐等创新,兼顾生成效率与自然度;核心适配虚拟歌手打造、音乐二创、专业创作辅助、个性化娱乐等场景。
SoulX-FlashTalk是Soul App旗下AI团队开源的首款14B参数实时数字人生成模型,实现0.87秒亚秒级延迟、32fps高帧率输出,凭借双向流式蒸馏与多步自纠正核心机制,达成无限时长稳定生成、全身动作交互及多语言驱动能力。
