web建站教程
     
  1. 首页
  2. 前端UI组件库
  3. AI项目和框架
  4. 前端知识
  5. AI应用
  6. IT知识
  7. ComfyUI插件
  8. 地图大全
  9. 休息站

GitHub仓库

InfinityStar:字节跳动推出的高效开源视频生成模型
InfinityStar:字节跳动推出的高效开源视频生成模型

InfinityStar是字节跳动推出的高效视频生成模型,该模型支持文本到图像、文本到视频、图像到视频及长时间交互视频合成等多类任务,且所有代码与模型均已开源。

GitHub仓库字节跳动框架视频生成模型
豆包网页版支持AI聊天,AI图片生成,AI漫画生成,AI写作等
[推荐] 豆包网页版:支持AI聊天,AI图片生成,AI漫画生成,AI写作等

字节跳动开发的一款多功能人工智能工具,基于云雀模型(豆包大模型)构建。它不仅是一个AI聊天机器人,还具备多种功能,包括写作助手、英语学习助手、音乐生成、编程助理等。

AI写作平台AI图片生成AI漫画生成工具AI聊天助手
Youtu-Embedding:腾讯优图开源企业级通用文本表示模型
Youtu-Embedding:腾讯优图开源企业级通用文本表示模型

Youtu-Embedding是腾讯优图实验室重磅推出的开源企业级通用文本表示模型,依托大规模语料预训练与创新协同-判别式微调框架,构建起强大的语义理解能力,可一站式胜任文本检索、意图理解、相似度判断等六大核心任务。

GitHub仓库企业级AI腾讯优图腾讯开源
DiaMoE-TTS:清华 × 巨人网络联合开源的多方言TTS框架
DiaMoE-TTS:清华 × 巨人网络联合开源的多方言TTS框架

DiaMoE-TTS是清华大学与巨人网络联合研发的多方言语音合成框架,框架创新性采用国际音标统一输入体系,融合方言感知的混合专家(MoE)架构与低资源适配策略,实现低成本、低门槛的多方言语音合成。

GitHub仓库多方言TTS框架巨人网络清华大学
Qwen3-VL Cookbooks:阿里出品的Qwen3-VL多模态模型实战指南集
Qwen3-VL Cookbooks:阿里出品的Qwen3-VL多模态模型实战指南集

Qwen3-VL Cookbooks是阿里巴巴为Qwen3-VL多模态大模型量身打造的官方实战指南集合,指南覆盖物体识别、文档解析、视频理解、3D定位等十余类核心能力,每一份Cookbook均配套详细代码示例、分步操作教程与场景化最佳实践。

GitHub仓库Qwen3-VL阿里云AI
MineContext:字节跳动开源主动式上下文感知的AI工具

MineContext是字节跳动推出的开源主动式上下文感知AI工具,创新性提出“数字生活方块挖掘”理念,帮助用户高效管理分散的知识与信息资产。

AI工具GitHub仓库上下文处理字节开源
Get Jobs:开源简历投递自动化工具,多平台高效求职利器
Get Jobs:开源简历投递自动化工具,多平台高效求职利器

Get Jobs是一款开源自动化简历投递工具,专为求职者打造高效求职解决方案。工具支持Boss直聘、猎聘、拉勾、51job、智联招聘等主流招聘平台。

AI简历GitHub仓库
VoxCPM:0.5B轻量语音生成模型,重塑高保真实时语音合成体验
VoxCPM:0.5B轻量语音生成模型,重塑高保真实时语音合成体验

VoxCPM支持零样本声音克隆,仅需一段参考音频,即可精准复刻说话者的音色、口音、情感语调等细微特征,生成高度逼真的个性化语音。其推理效率同样表现卓越,在NVIDIA RTX 4090 GPU上实时因子(RTF)低至0.17,完美满足实时交互场景需求。

GitHub仓库清华大学语音生成模型面壁智能
LucaVirus:阿里云重磅发布 核酸-蛋白质统一语言模型
LucaVirus:阿里云重磅发布 核酸-蛋白质统一语言模型

LucaVirus是阿里云LucaGroup潜心研发的全球首款专为病毒领域打造的核酸-蛋白质统一语言模型,依托254亿个核苷酸与氨基酸标记的海量数据完成训练,数据覆盖几乎所有已知病毒种类。

AI医学助手GitHub仓库病毒基础大模型阿里开源
FLM-Audio:北京智源等联合开发的原生全双工音频对话大模型
FLM-Audio:北京智源等联合开发的原生全双工音频对话大模型

FLM-Audio是由北京智源人工智能研究院携手Spin Matrix、新加坡南洋理工大学联合研发的原生全双工音频对话大模型,全面支持中英双语交互,凭借突破性技术架构与训练范式,重新定义智能语音对话的自然流畅体验。

GitHub仓库Spin Matrix南洋理工大学智源研究院音频对话模型
AgentCPM-Explore:清华等联合研发的轻量级开源智能体模型
AgentCPM-Explore:清华等联合研发的轻量级开源智能体模型

AgentCPM-Explore是由清华、人大、面壁智能与OpenBMB开源社区联合研发的轻量级开源智能体模型。该模型仅依托4B参数规模,却在多项长程任务评测基准中超越同尺寸乃至更大参数量的模型,展现出极高的能力密度;同时支持超100轮稳定交互,具备强大的深度探索能力。

GitHub仓库OpenBMB中国人民大学智能体模型清华大学面壁智能
TextBase:极简AI聊天机器人开发框架,快速搭建可定制化对话应用
TextBase:极简AI聊天机器人开发框架,快速搭建可定制化对话应用

TextBase是一款专为AI聊天机器人开发设计的轻量级Python框架,核心优势在于极简易用、高度可扩展,能帮助开发者快速搭建、迭代和优化聊天机器人,是从入门到生产级聊天机器人开发的优选工具。

AI开源项目AI聊天机器人GitHub仓库Python框架
LucidDreamer:无域限制3D场景生成管道,解锁真实世界级场景创作
LucidDreamer:无域限制3D场景生成管道,解锁真实世界级场景创作

LucidDreamer是一款一款无域限制的3D场景生成管道,深度借助现有大规模扩散生成模型的强大能力,实现跨领域、高保真的3D场景创作。

3D场景AI开源项目GitHub仓库
Audio2PhotoReal:Meta AI重磅技术,音频直驱超写实全身虚拟人物生成
Audio2PhotoReal:Meta AI重磅技术,音频直驱超写实全身虚拟人物生成

Audio2PhotoReal生成的虚拟人物不仅视觉质感逼真,更能细腻复刻对话中的各类微动作与表情——无论是指点、手腕抖动、耸肩等肢体姿态,还是微笑、嘲笑等面部神情,都能精准呈现,打破“音频-视觉”的生成壁垒。

AI开源项目GitHub仓库Meta AI虚拟人物形象
StreamRAG:ChatGPT可交互的视频搜索与流媒体代理工具,精准定位任意视频时刻

StreamRAG是一款开源的视频搜索与流媒体代理工具,核心能力是让你在 ChatGPT 中与自有视频库“对话”并直接观看视频流。

AI开源项目AI流媒体GitHub仓库代理工具视频搜索
MoneyPrinter:零门槛YouTube短视频自动生成工具,轻松开启创作变现
MoneyPrinter:零门槛YouTube短视频自动生成工具,轻松开启创作变现

MoneyPrinter是一款专为短视频创作变现设计的自动化工具,核心功能是输入视频主题即可自动生成YouTube Shorts短视频,全程无需专业视频编辑技能,从内容生成到平台上传全流程自动化,助力快速开启YouTube创作赚钱之路。

AI开源项目GitHub仓库短视频工具
扣子空间 – 免费全能AI办公智能体
Trae:新一代免费的AI编程工具