web建站教程
     
  1. 首页
  2. 前端UI组件库
  3. AI项目和框架
  4. 前端知识
  5. AI应用
  6. IT知识
  7. Chrome插件
  8. 地图大全
  9. 休息站

AI项目和框架

LiveSketch:文本驱动静态素描动画生成工具,让涂鸦轻松 “活” 起来
LiveSketch:文本驱动静态素描动画生成工具,让涂鸦轻松 “活” 起来

LiveSketch是一款聚焦“素描动效化”的AI生成视频工具,它为用户提供了直观、低门槛的创作方式,无需专业动画技能,就能让寥寥几笔的涂鸦或素描赋予生命,广泛适配讲故事、插画展示、网站设计、演示文稿等多元场景,让静态视觉内容更丰富有趣。

AI开源项目AI生成视频工具
LucidDreamer:无域限制3D场景生成管道,解锁真实世界级场景创作
LucidDreamer:无域限制3D场景生成管道,解锁真实世界级场景创作

LucidDreamer是一款一款无域限制的3D场景生成管道,深度借助现有大规模扩散生成模型的强大能力,实现跨领域、高保真的3D场景创作。

3D场景AI开源项目GitHub仓库
DemoFusion:开源AI图像重绘增强工具,轻松实现16倍+超分与细节焕新
DemoFusion:开源AI图像重绘增强工具,轻松实现16倍+超分与细节焕新

与传统“单纯放大”不同,DemoFusion采用创新的补丁式处理方案:先通过Stable Diffusion等免费开源AI模型生成低分辨率基础图像,再通过专属框架挖掘模型潜力,为图像添加丰富细节并提升分辨率,实现“超分+细节增强”的双重效果,而非简单拉伸像素。

AI图像增强AI图像重绘AI开源项目
HandRefiner:精准修正畸形手部的图像后处理方案,无损原图风格与内容
HandRefiner:精准修正畸形手部的图像后处理方案,无损原图风格与内容

HandRefiner提出一种针对性图像后处理方法,核心目标是在完全保留图像其他部分原貌的前提下,精准修正生成图像中形状异常的手部。

AI图像生成模型AI开源项目github项目
DreamTalk:清华联合阿里、华中科大研发,音频驱动的高逼真照片说话框架

DreamTalk是由清华大学、阿里巴巴与华中科技大学联合开发的扩散模型驱动面部动画生成框架,核心能力是让静态人物照片“开口说话”,支持匹配歌曲、多语言语音、嘈杂音频等多种声音类型,生成的唇部动作与表情风格高度自然逼真,打破了传统照片说话技术对纯净音频、表情参考的依赖。

AI开源项目华中科大开放式扩散模型清华大学阿里巴巴框架
VideoCrafter:腾讯联合高校打造,支持多场景连贯生成的开源视频扩散模型
VideoCrafter:腾讯联合高校打造,支持多场景连贯生成的开源视频扩散模型

VideoCrafter基于扩散模型与机器学习技术,支持文本到视频(Text2Video)、图像到视频(Image2Video)两大核心能力,即使是无视频编辑或动画经验的新手,也能轻松制作出媲美专业水准的视频内容。

AI开源项目开放式扩散模型腾讯AI
Audio2PhotoReal:Meta AI重磅技术,音频直驱超写实全身虚拟人物生成
Audio2PhotoReal:Meta AI重磅技术,音频直驱超写实全身虚拟人物生成

Audio2PhotoReal生成的虚拟人物不仅视觉质感逼真,更能细腻复刻对话中的各类微动作与表情——无论是指点、手腕抖动、耸肩等肢体姿态,还是微笑、嘲笑等面部神情,都能精准呈现,打破“音频-视觉”的生成壁垒。

AI开源项目GitHub仓库Meta AI虚拟人物形象
Make-A-Character:文本驱动的超写实3D数字人全栈生成工具
Make-A-Character:文本驱动的超写实3D数字人全栈生成工具

Make-A-Character是一款文本驱动的3D数字人生成工具,核心能力是通过一句话描述,精准捕捉脸型、五官、发型等人物特征,高效规模化生成具备全栈式美术能力的超写实3D数字人。

3D数字人文生工具
Personalized Restoration:面部精准恢复 + 个性编辑技术,让每一张脸都忠于原貌
Personalized Restoration:面部精准恢复 + 个性编辑技术,让每一张脸都忠于原貌

Personalized Restoration是一项聚焦面部图像精准修复与个性化编辑的创新技术,核心优势在于既能高效复原受损图像的细节,又能精准捕捉并重现个人独特面部特征,实现“清晰自然”与“身份忠实”的双重保障。

AI开源项目AI面部恢复
MedGemma 1.5:谷歌开源多模态医学AI模型,赋能临床实践与医学研究
MedGemma 1.5:谷歌开源多模态医学AI模型,赋能临床实践与医学研究

MedGemma 1.5是谷歌推出的开源多模态医学专用模型,专为处理医学影像与文本数据设计,深度整合高维影像解读、医学文档理解、电子健康记录(EHR)分析等核心能力。

AI医疗模型AI开源模型谷歌AI
DDColor:达摩院双解码器图像上色算法,让黑白画面自然焕彩
DDColor:达摩院双解码器图像上色算法,让黑白画面自然焕彩

阿里巴巴达摩院团队研发的DDColor,作为魔搭大模型生态下的新一代图像上色算法,凭借创新的双解码器技术,实现了图像上色领域的变革性突破。无论是历史黑白照片、动漫场景还是游戏风景,都能输出色彩自然、细节逼真的彩色图像,尤其在多物体、复杂上下文场景中表现突出。

AI配色工具阿里达摩院魔搭模型
LibreChat:开源增强版AI聊天平台,一站式整合多模型与全场景功能
LibreChat:开源增强版AI聊天平台,一站式整合多模型与全场景功能

LibreChat是一款免费开源的增强版ChatGPT替代平台,核心优势是深度整合全球主流AI模型与丰富扩展功能,既还原ChatGPT的直观交互体验,又突破单一模型的能力局限。

ChatGPT聊天机器人
DiffusionGPT:字节跳动出品,LLM驱动的智能文本生图一站式系统
DiffusionGPT:字节跳动出品,LLM驱动的智能文本生图一站式系统

DiffusionGPT是字节跳动研发的大语言模型驱动型文本生成图像多合一系统,核心目标是精准解析各类文本提示,智能匹配最优图像生成模型,输出高质量、高契合度的图像内容。

AI开源项目字节跳动框架文本生成图像
Lumiere:谷歌研究院出品,基于时空架构的文本到视频生成扩散模型
Lumiere:谷歌研究院出品,基于时空架构的文本到视频生成扩散模型

Lumiere是谷歌研究院研发的时空文本到视频扩散模型,核心创新在于采用空间时间U-Net架构——摒弃传统模型逐帧合成的模式,通过单次传递即可生成视频的完整时间序列,从根源上保障视频的全局时间一致性与画面逼真度,赋能多元内容创作与视频编辑任务。

AI开源项目视频扩散模型谷歌研究院
SupIR:大模型驱动的智能图像修复技术,文本指令精准焕新图像质感
SupIR:大模型驱动的智能图像修复技术,文本指令精准焕新图像质感

SupIR是一项通过模型规模扩容实现图像修复能力跃升的突破性技术,依托生成先验与多模态融合技术,支持文本提示驱动的智能修复,大幅提升图像修复的质量、精细度与智能化水平,为图像复原、画质增强领域带来全新解决方案。

AI图像处理功能AI图像复原AI画质增强智能图像修复
扣子空间 – 免费全能AI办公智能体
Trae:新一代免费的AI编程工具