ComfyUI-QwenASR是专为Qwen3-ASR(自动语音识别)模型打造的ComfyUI自定义节点包,核心定位是为ComfyUI用户提供“简单、可靠、高效”的语音转文本及字幕生成解决方案。无需依赖复杂外部工具或命令行操作,仅通过可视化节点拖拽,即可快速完成全流程语音处理任务,大幅降低语音识别的使用门槛。
ComfyUI-QwenASR节点包深度聚焦实际应用场景,在基础语音转文本功能之上,针对长音频处理、精准字幕生成等高频需求做了专项优化;同时内置本地模型缓存、双下载源适配等实用设计,既提升了操作便捷度,也针对性优化了国内用户的下载与运行体验。适用于内容创作者、音频从业者及ComfyUI爱好者,可高效处理播客、会议录音、短视频音频等各类语音内容的转写与字幕制作。

ComfyUI-QwenASR功能特性:
1、双核心节点,轻量按需选择
内置两个核心节点,分别对应「简易语音转文本」与「字幕生成」,按需选用即可,无需加载冗余功能,兼顾轻量性与高效性,新手也能快速上手。
2、长音频自动分块,无需手动切割
无需手动拆分长音频,节点在模型管道内部自动完成分块处理,轻松应对长篇会议录音、播客、有声书等长时程音频,大幅提升处理效率,避免繁琐操作。
3、强制对齐器,字幕精准无偏差
内置强制对齐器模型,可为转录内容生成带精准时间轴的字幕,彻底解决普通字幕时间轴偏差大的痛点,完美适配视频字幕制作等高精度需求。
4、本地模型缓存,离线可用更便捷
下载的模型统一缓存至 ComfyUI/models/Qwen3-ASR/ 目录,后续使用无需重复下载,节省网络带宽;模型下载完成后,支持完全离线运行,不受网络限制。
5、双下载源适配,国内用户更友好
支持 HuggingFace 与 ModelScope 双下载源,国内用户可优先选择 ModelScope 源,获得更快的下载速度和更稳定的连接,有效避免网络超时问题。
6、输出灵活可配置,适配多样需求
字幕生成节点支持 none/txt/srt 多种输出格式,可自定义输出路径,既能满足普通用户的直接使用需求,也能适配高级用户的后续二次处理场景。
ComfyUI-QwenASR安装步骤:
步骤1:克隆项目仓库到ComfyUI自定义节点目录
打开终端(Windows使用CMD/PowerShell,Mac/Linux使用终端),切换到ComfyUI的custom_nodes目录,然后克隆项目源码:
# 切换到ComfyUI自定义节点目录(请替换为你的ComfyUI实际路径) cd ComfyUI/custom_nodes # 克隆项目仓库 git clone https://github.com/1038lab/ComfyUI-QwenASR.git
步骤2:安装项目所需依赖包
进入项目目录,执行命令安装requirements.txt中列出的所有依赖(PS:依赖项较多且有固定版本的依赖项,可能会与其他节点冲突),保证节点能够正常运行:
# 进入ComfyUI-QwenASR项目目录 cd ComfyUI-QwenASR # 安装依赖包 pip install -r requirements.txt
步骤3:重启ComfyUI,验证节点是否生效
安装完成后,关闭当前正在运行的ComfyUI服务,然后重新启动ComfyUI。
ComfyUI-LaoLi-Shadow安装插件入口,面向ComfyUI的底层性能加速插件
ComfyUI_SoX_Effects插件使用入口,61种效果全覆盖,灵活工作流+进阶功能
Comfy Pilot插件安装入口,专为Claude Code与ComfyUI的通信插件
ComfyUI-Grok-SmartVAE插件安装入口,专为LTX-Video、AnimateDiff等主流长视频序列模型设计
ComfyUI-CacheDiT模型安装入口,为ComfyUI设计的DiT模型一键加速插件
上面是“ComfyUI-QwenASR官网使用入口,专为Qwen3-ASR模型打造的ComfyUI自定义节点包”的全面内容,想了解更多关于 ComfyUI插件 内容,请继续关注web建站教程。
当前网址:https://ipkd.cn/webs_31161.html
猜你喜欢
声明:本站提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请发送到邮箱:admin@ipkd.cn,我们会在看到邮件的第一时间内为您处理!

js+css3如何实现监听过渡动画结束事件
Genstory官网:免费AI故事生成平台,瞬间将想法转化为精美的绘本故事
el-form清除rules校验 











