Hibiki-Zero继承其前身Hibiki的多流RQ-Transformer架构,采用仅解码器设计,核心依托流式神经音频编解码器Mimi,以12.5Hz恒定帧率,对源音频、目标音频,以及用于内部推理的“内心独白”文本流进行联合建模。这种一体化设计赋予模型持续处理输入语音流的能力,可同步输出连续的翻译音频及带时间戳的对应文本,完美适配实时交互场景。
php语法 dedecms建站 栏目 mysql语法 织梦 GitHub仓库 AI开源项目 CMS网站 DeepSeek 调用