
Voxtral-Mini-4B-Realtime-2602是Mistral AI正式开源的实时流式语音识别模型,仅40亿参数,即可在保持高精度的前提下,实现500ms以内超低延迟,并原生支持中文等13种语言。

Voxtral Transcribe 2是Mistral AI推出的新一代语音转文本模型系列,包含两款定位差异化的核心版本,兼顾批量处理与实时交互场景,在准确率、性价比与多场景适配性上全面升级。其中,Voxtral Mini Transcribe V2聚焦批量转录需求,支持13种语言、说话人分离、词级时间戳及上下文偏置功能。
