web建站教程
     
  1. 首页
  2. 前端UI组件库
  3. AI项目和框架
  4. AIGC工具
  5. 百度echarts
  6. 地图大全
  7. 前端知识
  8. 更多
    vuejs
    js入门
    php入门
    mysql
    wordpress
    织梦cms
    帝国cms
    git教程
    IT知识
    模板大全
    休息站
    AI应用

GitHub仓库

DiaMoE-TTS:清华 × 巨人网络联合开源的多方言TTS框架
DiaMoE-TTS:清华 × 巨人网络联合开源的多方言TTS框架

DiaMoE-TTS是清华大学与巨人网络联合研发的多方言语音合成框架,框架创新性采用国际音标统一输入体系,融合方言感知的混合专家(MoE)架构与低资源适配策略,实现低成本、低门槛的多方言语音合成。

GitHub仓库多方言TTS框架巨人网络清华大学
Qwen3-VL Cookbooks:阿里出品的Qwen3-VL多模态模型实战指南集
Qwen3-VL Cookbooks:阿里出品的Qwen3-VL多模态模型实战指南集

Qwen3-VL Cookbooks是阿里巴巴为Qwen3-VL多模态大模型量身打造的官方实战指南集合,指南覆盖物体识别、文档解析、视频理解、3D定位等十余类核心能力,每一份Cookbook均配套详细代码示例、分步操作教程与场景化最佳实践。

GitHub仓库Qwen3-VL阿里云AI
MineContext:字节跳动开源主动式上下文感知的AI工具

MineContext是字节跳动推出的开源主动式上下文感知AI工具,创新性提出“数字生活方块挖掘”理念,帮助用户高效管理分散的知识与信息资产。

AI工具GitHub仓库上下文处理字节开源
Get Jobs:开源简历投递自动化工具,多平台高效求职利器
Get Jobs:开源简历投递自动化工具,多平台高效求职利器

Get Jobs是一款开源自动化简历投递工具,专为求职者打造高效求职解决方案。工具支持Boss直聘、猎聘、拉勾、51job、智联招聘等主流招聘平台。

AI简历GitHub仓库
VoxCPM:0.5B轻量语音生成模型,重塑高保真实时语音合成体验
VoxCPM:0.5B轻量语音生成模型,重塑高保真实时语音合成体验

VoxCPM支持零样本声音克隆,仅需一段参考音频,即可精准复刻说话者的音色、口音、情感语调等细微特征,生成高度逼真的个性化语音。其推理效率同样表现卓越,在NVIDIA RTX 4090 GPU上实时因子(RTF)低至0.17,完美满足实时交互场景需求。

GitHub仓库清华大学语音生成模型面壁智能
LucaVirus:阿里云重磅发布 核酸-蛋白质统一语言模型
LucaVirus:阿里云重磅发布 核酸-蛋白质统一语言模型

LucaVirus是阿里云LucaGroup潜心研发的全球首款专为病毒领域打造的核酸-蛋白质统一语言模型,依托254亿个核苷酸与氨基酸标记的海量数据完成训练,数据覆盖几乎所有已知病毒种类。

AI医学助手GitHub仓库病毒基础大模型阿里开源
FLM-Audio:北京智源等联合开发的原生全双工音频对话大模型
FLM-Audio:北京智源等联合开发的原生全双工音频对话大模型

FLM-Audio是由北京智源人工智能研究院携手Spin Matrix、新加坡南洋理工大学联合研发的原生全双工音频对话大模型,全面支持中英双语交互,凭借突破性技术架构与训练范式,重新定义智能语音对话的自然流畅体验。

GitHub仓库Spin Matrix南洋理工大学智源研究院音频对话模型
AgentCPM-Explore:清华等联合研发的轻量级开源智能体模型
AgentCPM-Explore:清华等联合研发的轻量级开源智能体模型

AgentCPM-Explore是由清华、人大、面壁智能与OpenBMB开源社区联合研发的轻量级开源智能体模型。该模型仅依托4B参数规模,却在多项长程任务评测基准中超越同尺寸乃至更大参数量的模型,展现出极高的能力密度;同时支持超100轮稳定交互,具备强大的深度探索能力。

GitHub仓库OpenBMB中国人民大学智能体模型清华大学面壁智能
TextBase:极简AI聊天机器人开发框架,快速搭建可定制化对话应用
TextBase:极简AI聊天机器人开发框架,快速搭建可定制化对话应用

TextBase是一款专为AI聊天机器人开发设计的轻量级Python框架,核心优势在于极简易用、高度可扩展,能帮助开发者快速搭建、迭代和优化聊天机器人,是从入门到生产级聊天机器人开发的优选工具。

AI开源项目AI聊天机器人GitHub仓库Python框架
LucidDreamer:无域限制3D场景生成管道,解锁真实世界级场景创作
LucidDreamer:无域限制3D场景生成管道,解锁真实世界级场景创作

LucidDreamer是一款一款无域限制的3D场景生成管道,深度借助现有大规模扩散生成模型的强大能力,实现跨领域、高保真的3D场景创作。

3D场景AI开源项目GitHub仓库
Audio2PhotoReal:Meta AI重磅技术,音频直驱超写实全身虚拟人物生成
Audio2PhotoReal:Meta AI重磅技术,音频直驱超写实全身虚拟人物生成

Audio2PhotoReal生成的虚拟人物不仅视觉质感逼真,更能细腻复刻对话中的各类微动作与表情——无论是指点、手腕抖动、耸肩等肢体姿态,还是微笑、嘲笑等面部神情,都能精准呈现,打破“音频-视觉”的生成壁垒。

AI开源项目GitHub仓库Meta AI虚拟人物形象
StreamRAG:ChatGPT可交互的视频搜索与流媒体代理工具,精准定位任意视频时刻

StreamRAG是一款开源的视频搜索与流媒体代理工具,核心能力是让你在 ChatGPT 中与自有视频库“对话”并直接观看视频流。

AI开源项目AI流媒体GitHub仓库代理工具视频搜索
MoneyPrinter:零门槛YouTube短视频自动生成工具,轻松开启创作变现
MoneyPrinter:零门槛YouTube短视频自动生成工具,轻松开启创作变现

MoneyPrinter是一款专为短视频创作变现设计的自动化工具,核心功能是输入视频主题即可自动生成YouTube Shorts短视频,全程无需专业视频编辑技能,从内容生成到平台上传全流程自动化,助力快速开启YouTube创作赚钱之路。

AI开源项目GitHub仓库短视频工具
StreamMultiDiffusion:实时交互式区域控图,重塑AI图像生成与编辑体验
StreamMultiDiffusion:实时交互式区域控图,重塑AI图像生成与编辑体验

StreamMultiDiffusion凭借区域控图、实时交互、全景生成等核心优势,成为一款兼顾专业性与易用性的全能型图像生成编辑工具,为实时AI创作场景提供了高效、灵活的解决方案。

AI图像生成工具AI开源项目GitHub仓库
ComfyUI-APISR:专注动漫领域的图像视频超分辨率增强工具
ComfyUI-APISR:专注动漫领域的图像视频超分辨率增强工具

APISR是一款专为动漫内容打造的超分辨率处理项目,聚焦解决现实场景中低质量、低分辨率动漫图像与视频的画质退化问题。它支持2x、4x等多档位上采样因子权重,可精准提升画面清晰度与细节表现力,为动漫爱好者和创作者提供专业的画质增强方案。

AI增强工具AI开源项目GitHub仓库
Trae:新一代免费的AI编程工具