
ComfyUI-VideoMaMa通过自定义节点,即可在ComfyUI原生界面中,可视化操控VideoMaMa的全部核心能力。从视频加载、遮罩生成,到抠图推理,全程一键式操作、拖拽式完成;同时集成SAM2模型,实现交互式遮罩生成,哪怕是零基础用户,也能轻松做出专业级视频抠图效果,彻底打破“视频抠图门槛高、操作复杂”的壁垒。

ComfyUI-Youtu-VL插件是专为腾讯40亿参数轻量级视觉语言模型(Youtu-VL)打造的ComfyUI自定义节点插件,适配Youtu-VL模型的全量视觉任务,包括视觉定位、图像分割、深度估计、姿态估计等。

ComfyUI Prompt Helper的核心亮点的是对Qwen3-4B-Z-Image-Engineer模型的深度集成,专为Z-Image、Qwen Image等当前主流图像模型优化提示词结构,核心聚焦正向约束强化、纹理细节补充、电影级相机参数适配,帮用户快速将简单描述转化为高密度、结构化的专业提示词,大幅提升图像生成精度与质感,无缝适配ComfyUI原生工作流。

ComfyUI-Qwen-TTS是基于阿里巴巴Qwen团队开源项目Qwen3-TTS打造的ComfyUI专用自定义节点集,为ComfyUI提供一站式文本转语音、声音克隆、声音风格设计与多角色对话合成能力,支持高质量、低延迟、多语言的端到端语音生成,可直接嵌入图像/视频工作流使用。

ComfyUI AudioSR是专为ComfyUI打造的原生音频超分辨率处理节点,基于先进的潜在扩散模型AudioSR研发,核心能力是将任意低质量音频(低采样率、低码率)上采样至48kHz标准音质,同时精准增强高频细节、修复压缩失真问题,实现音频清晰度、饱满度的显著提升,完美适配ComfyUI音频处理工作流。

ComfyUI-Cinematic-Prompt是ComfyUI专属可视化提示词构建工具,原生适配Midjourney、Stable Diffusion、Nanobanana pro、Flux等主流生成工作流,同时完美支持文生图、图生图两大核心场景,让电影化提示词搭建更直观、更高效。