web建站教程
     
  1. 首页
  2. 前端UI组件库
  3. AI项目和框架
  4. 前端知识
  5. AI应用
  6. IT知识
  7. ComfyUI插件
  8. 地图大全
  9. 休息站

AI开源项目

DiffusionGPT:字节跳动出品,LLM驱动的智能文本生图一站式系统
DiffusionGPT:字节跳动出品,LLM驱动的智能文本生图一站式系统

DiffusionGPT是字节跳动研发的大语言模型驱动型文本生成图像多合一系统,核心目标是精准解析各类文本提示,智能匹配最优图像生成模型,输出高质量、高契合度的图像内容。

AI开源项目字节跳动框架文本生成图像
豆包网页版支持AI聊天,AI图片生成,AI漫画生成,AI写作等
[推荐] 豆包网页版:支持AI聊天,AI图片生成,AI漫画生成,AI写作等

字节跳动开发的一款多功能人工智能工具,基于云雀模型(豆包大模型)构建。它不仅是一个AI聊天机器人,还具备多种功能,包括写作助手、英语学习助手、音乐生成、编程助理等。

AI写作平台AI图片生成AI漫画生成工具AI聊天助手
Lumiere:谷歌研究院出品,基于时空架构的文本到视频生成扩散模型
Lumiere:谷歌研究院出品,基于时空架构的文本到视频生成扩散模型

Lumiere是谷歌研究院研发的时空文本到视频扩散模型,核心创新在于采用空间时间U-Net架构——摒弃传统模型逐帧合成的模式,通过单次传递即可生成视频的完整时间序列,从根源上保障视频的全局时间一致性与画面逼真度,赋能多元内容创作与视频编辑任务。

AI开源项目视频扩散模型谷歌研究院
DuckDB-NSQL:专为DuckDB打造的自然语言转SQL工具,零SQL基础也能玩转数据库
DuckDB-NSQL:专为DuckDB打造的自然语言转SQL工具,零SQL基础也能玩转数据库

DuckDB-NSQL是一款针对 DuckDB 数据库定制的文本到SQL专用模型,核心能力是将用户的自然语言查询需求,精准转换成可直接执行的DuckDB SQL代码——让你无需掌握SQL语法,仅用日常语言就能与数据库“对话”,大幅简化数据查询与处理流程。

AI开源项目DuckDB数据库
StreamRAG:ChatGPT可交互的视频搜索与流媒体代理工具,精准定位任意视频时刻

StreamRAG是一款开源的视频搜索与流媒体代理工具,核心能力是让你在 ChatGPT 中与自有视频库“对话”并直接观看视频流。

AI开源项目AI流媒体GitHub仓库代理工具视频搜索
WhisperFusion:低延迟AI实时对话神器,融合语音交互与深度语义理解
WhisperFusion:低延迟AI实时对话神器,融合语音交互与深度语义理解

WhisperFusion是一款基于开源工具WhisperLive与WhisperSpeech打造的实时对话解决方案,核心优势在于实现人与AI聊天机器人的超低延迟交互。

AI开源项目AI聊天机器人声音转文字
Audio2Face:英伟达AI语音秒生成高表现力3D面部动画
Audio2Face:英伟达AI语音秒生成高表现力3D面部动画

Audio2Face是英伟达推出的AI驱动3D面部动画生成工具,能够根据任意语音音轨,快速生成匹配情绪与节奏的逼真面部动画。

3D面部动画AI开源项目英伟达
Media2Face:多模态驱动的高逼真共语言面部动画生成工具
Media2Face:多模态驱动的高逼真共语言面部动画生成工具

Media2Face是一款基于音频、文本、图像多模态引导的3D面部动画生成工具,专注于打造自然逼真的拟人化面部表情与动作。

AI开源项目动画生成工具
MoneyPrinter:零门槛YouTube短视频自动生成工具,轻松开启创作变现
MoneyPrinter:零门槛YouTube短视频自动生成工具,轻松开启创作变现

MoneyPrinter是一款专为短视频创作变现设计的自动化工具,核心功能是输入视频主题即可自动生成YouTube Shorts短视频,全程无需专业视频编辑技能,从内容生成到平台上传全流程自动化,助力快速开启YouTube创作赚钱之路。

AI开源项目GitHub仓库短视频工具
OOTDiffusion:高可控开源虚拟试穿工具,服装贴合度拉满
OOTDiffusion:高可控开源虚拟试穿工具,服装贴合度拉满

OOTDiffusion是一款基于潜在扩散模型打造的高度可控开源虚拟试穿工具,支持根据不同性别、体型自动适配服装版型,实现服装与模特的精准贴合;同时支持自定义参数调整试穿效果,提供半身、全身双模型模式,满足多样化试穿需求。

AI开源项目AI虚拟试穿github项目
SoraWebui:开源文本生成视频平台,轻松对接OpenAI Sora能力
SoraWebui:开源文本生成视频平台,轻松对接OpenAI Sora能力

SoraWebui是一个开源项目,允许用户使用OpenAI的Sora模型使用文本在线生成视频,从而简化视频创建,并具有轻松的一键网站部署功能。

AI开源项目OpenAISora文本生成视频
Beeble AI:赋能虚拟制片的AI图像重照明与合成平台
Beeble AI:赋能虚拟制片的AI图像重照明与合成平台

Beeble AI是一款尖端的人工智能虚拟制片平台,凭借先进的AI模型实现高精度图像合成与逼真重照明,为专业创作者提供灵活、高效的视觉效果制作方案,重塑虚拟制片、图像合成与VFX工作流。

AI合成平台AI图像AI开源项目虚拟制片平台
Animagine XL 3.1:开源动漫专用文本生成图像模型,全风格覆盖与画质跃升
Animagine XL 3.1:开源动漫专用文本生成图像模型,全风格覆盖与画质跃升

Animagine XL 3.1是一款专注于动漫领域的开源文本生成图像模型,通过扩充海量标注数据集,实现了对从经典老番到最新作品、从复古风格到现代美学的全维度动漫风格覆盖,为动漫创作者提供高精度、多样化的图像生成解决方案。

AI开源项目图像动漫模型文本生成图像
StreamMultiDiffusion:实时交互式区域控图,重塑AI图像生成与编辑体验
StreamMultiDiffusion:实时交互式区域控图,重塑AI图像生成与编辑体验

StreamMultiDiffusion凭借区域控图、实时交互、全景生成等核心优势,成为一款兼顾专业性与易用性的全能型图像生成编辑工具,为实时AI创作场景提供了高效、灵活的解决方案。

AI图像生成工具AI开源项目GitHub仓库
ComfyUI-APISR:专注动漫领域的图像视频超分辨率增强工具
ComfyUI-APISR:专注动漫领域的图像视频超分辨率增强工具

APISR是一款专为动漫内容打造的超分辨率处理项目,聚焦解决现实场景中低质量、低分辨率动漫图像与视频的画质退化问题。它支持2x、4x等多档位上采样因子权重,可精准提升画面清晰度与细节表现力,为动漫爱好者和创作者提供专业的画质增强方案。

AI增强工具AI开源项目GitHub仓库
AniPortrait:腾讯出品,音频驱动的超逼真肖像动画生成框架
AniPortrait:腾讯出品,音频驱动的超逼真肖像动画生成框架

AniPortrait是腾讯研发团队打造的音频驱动肖像动画合成工具,仅需输入一段音频与一张静态人脸图片,即可生成表情自然、动作逼真的动态人脸视频,为创意创作、数字内容生产提供高效解决方案。

AI开源项目动画合成框架腾讯AI
扣子空间 – 免费全能AI办公智能体
Trae:新一代免费的AI编程工具