web建站教程
     
  1. 首页
  2. 前端UI组件库
  3. AI项目和框架
  4. AIGC工具
  5. 百度echarts
  6. 地图大全
  7. 前端知识
  8. 更多
    vuejs
    js入门
    php入门
    mysql
    wordpress
    织梦cms
    帝国cms
    git教程
    IT知识
    模板大全
    休息站
    AI应用

AI项目和框架

VideoCrafter:腾讯联合高校打造,支持多场景连贯生成的开源视频扩散模型
VideoCrafter:腾讯联合高校打造,支持多场景连贯生成的开源视频扩散模型

VideoCrafter基于扩散模型与机器学习技术,支持文本到视频(Text2Video)、图像到视频(Image2Video)两大核心能力,即使是无视频编辑或动画经验的新手,也能轻松制作出媲美专业水准的视频内容。

AI开源项目开放式扩散模型腾讯AI
Audio2PhotoReal:Meta AI重磅技术,音频直驱超写实全身虚拟人物生成
Audio2PhotoReal:Meta AI重磅技术,音频直驱超写实全身虚拟人物生成

Audio2PhotoReal生成的虚拟人物不仅视觉质感逼真,更能细腻复刻对话中的各类微动作与表情——无论是指点、手腕抖动、耸肩等肢体姿态,还是微笑、嘲笑等面部神情,都能精准呈现,打破“音频-视觉”的生成壁垒。

AI开源项目GitHub仓库Meta AI虚拟人物形象
Make-A-Character:文本驱动的超写实3D数字人全栈生成工具
Make-A-Character:文本驱动的超写实3D数字人全栈生成工具

Make-A-Character是一款文本驱动的3D数字人生成工具,核心能力是通过一句话描述,精准捕捉脸型、五官、发型等人物特征,高效规模化生成具备全栈式美术能力的超写实3D数字人。

3D数字人文生工具
Personalized Restoration:面部精准恢复 + 个性编辑技术,让每一张脸都忠于原貌
Personalized Restoration:面部精准恢复 + 个性编辑技术,让每一张脸都忠于原貌

Personalized Restoration是一项聚焦面部图像精准修复与个性化编辑的创新技术,核心优势在于既能高效复原受损图像的细节,又能精准捕捉并重现个人独特面部特征,实现“清晰自然”与“身份忠实”的双重保障。

AI开源项目AI面部恢复
MedGemma 1.5:谷歌开源多模态医学AI模型,赋能临床实践与医学研究
MedGemma 1.5:谷歌开源多模态医学AI模型,赋能临床实践与医学研究

MedGemma 1.5是谷歌推出的开源多模态医学专用模型,专为处理医学影像与文本数据设计,深度整合高维影像解读、医学文档理解、电子健康记录(EHR)分析等核心能力。

AI医疗模型AI开源模型谷歌AI
DDColor:达摩院双解码器图像上色算法,让黑白画面自然焕彩
DDColor:达摩院双解码器图像上色算法,让黑白画面自然焕彩

阿里巴巴达摩院团队研发的DDColor,作为魔搭大模型生态下的新一代图像上色算法,凭借创新的双解码器技术,实现了图像上色领域的变革性突破。无论是历史黑白照片、动漫场景还是游戏风景,都能输出色彩自然、细节逼真的彩色图像,尤其在多物体、复杂上下文场景中表现突出。

AI配色工具阿里达摩院魔搭模型
LibreChat:开源增强版AI聊天平台,一站式整合多模型与全场景功能
LibreChat:开源增强版AI聊天平台,一站式整合多模型与全场景功能

LibreChat是一款免费开源的增强版ChatGPT替代平台,核心优势是深度整合全球主流AI模型与丰富扩展功能,既还原ChatGPT的直观交互体验,又突破单一模型的能力局限。

ChatGPT聊天机器人
DiffusionGPT:字节跳动出品,LLM驱动的智能文本生图一站式系统
DiffusionGPT:字节跳动出品,LLM驱动的智能文本生图一站式系统

DiffusionGPT是字节跳动研发的大语言模型驱动型文本生成图像多合一系统,核心目标是精准解析各类文本提示,智能匹配最优图像生成模型,输出高质量、高契合度的图像内容。

AI开源项目字节跳动框架文本生成图像
Lumiere:谷歌研究院出品,基于时空架构的文本到视频生成扩散模型
Lumiere:谷歌研究院出品,基于时空架构的文本到视频生成扩散模型

Lumiere是谷歌研究院研发的时空文本到视频扩散模型,核心创新在于采用空间时间U-Net架构——摒弃传统模型逐帧合成的模式,通过单次传递即可生成视频的完整时间序列,从根源上保障视频的全局时间一致性与画面逼真度,赋能多元内容创作与视频编辑任务。

AI开源项目视频扩散模型谷歌研究院
SupIR:大模型驱动的智能图像修复技术,文本指令精准焕新图像质感
SupIR:大模型驱动的智能图像修复技术,文本指令精准焕新图像质感

SupIR是一项通过模型规模扩容实现图像修复能力跃升的突破性技术,依托生成先验与多模态融合技术,支持文本提示驱动的智能修复,大幅提升图像修复的质量、精细度与智能化水平,为图像复原、画质增强领域带来全新解决方案。

AI图像处理功能AI图像复原AI画质增强智能图像修复
OctoCodingBench:聚焦Coding Agent指令遵循能力的标准化评测集
OctoCodingBench:聚焦Coding Agent指令遵循能力的标准化评测集

ctoCodingBench是MiniMax推出的Coding Agent专项评测集,核心目标是评估代码生成Agent在真实软件开发场景中的指令遵循能力。

MiniMax视频
DuckDB-NSQL:专为DuckDB打造的自然语言转SQL工具,零SQL基础也能玩转数据库
DuckDB-NSQL:专为DuckDB打造的自然语言转SQL工具,零SQL基础也能玩转数据库

DuckDB-NSQL是一款针对 DuckDB 数据库定制的文本到SQL专用模型,核心能力是将用户的自然语言查询需求,精准转换成可直接执行的DuckDB SQL代码——让你无需掌握SQL语法,仅用日常语言就能与数据库“对话”,大幅简化数据查询与处理流程。

AI开源项目DuckDB数据库
司农大语言模型:南京农业大学推出的面向农业领域的垂直大模型
司农大语言模型:南京农业大学推出的面向农业领域的垂直大模型

司农大语言模型是南京农业大学依托自身学科优势打造的农业领域垂直大模型,收集了涵盖多农业学科的超40亿token数据,包括书籍、论文、政策等。

农业领域大模型南京农业大学垂直大模型
WhisperFusion:低延迟AI实时对话神器,融合语音交互与深度语义理解
WhisperFusion:低延迟AI实时对话神器,融合语音交互与深度语义理解

WhisperFusion是一款基于开源工具WhisperLive与WhisperSpeech打造的实时对话解决方案,核心优势在于实现人与AI聊天机器人的超低延迟交互。

AI开源项目AI聊天机器人声音转文字
PixVerse R1:爱诗科技打造,全球首个通用实时世界模型
PixVerse R1:爱诗科技打造,全球首个通用实时世界模型

PixVerse R1是爱诗科技(PixVerse)推出的全球首个通用实时世界模型,它重新定义了实时视频生成的效率与交互体验:Omni原生多模态基础模型实现文本、图像、音频、视频的一体化生成。

AI大模型多模态语言模型爱诗科技
Trae:新一代免费的AI编程工具