web建站教程
  1. 首页
  2. vuejs
  3. js
  4. 地图大全
  5. AIGC工具
  6. 前端知识
  7. 百度echarts
  8. 更多
    php入门
    nodejs
    mockjs
    reactjs
    mysql
    wordpress
    织梦cms
    帝国cms
    git教程
    IT知识
    模板大全
    休息站
    手机应用

AI项目和框架

mHC:DeepSeek团队推出的新型的神经网络架构设计方法,解决传统超连接
mHC:DeepSeek团队推出的新型的神经网络架构设计方法,解决传统超连接

mHC是DeepSeek团队研发的新型神经网络架构设计方法,直击传统超连接架构在大规模训练中稳定性不足的核心痛点,为超大规模模型的高效训练与性能突破提供了创新性解决方案。

DeepSeek
IQuest-Coder-V1:专注于代码生成、理解和优化的先进人工智能模型
IQuest-Coder-V1:专注于代码生成、理解和优化的先进人工智能模型

IQuest-Coder-V1是IQuestLab推出的专注于代码生成、理解和优化的先进人工智能模型,支持分组查询注意力(GQA)机制,原生支持128K上下文长度,能高效处理长代码片段和复杂工程上下文。40B参数的Loop版本通过循环/递归式架构,进一步优化了模型容量与部署效率。

AI代码助手代码生成器
AutoMV:支持将歌曲转化为连贯、与节奏对齐的音乐视频等AI音乐视频生成系统
AutoMV:支持将歌曲转化为连贯、与节奏对齐的音乐视频等AI音乐视频生成系统

AutoMV实现了从音频、歌词到完整音乐视频的端到端生成,凭借高效、低成本、高质量的核心优势,为音乐视频创作领域提供了全新解决方案。

AI音乐生成工具M-A-P北邮大学南京大学
Tencent-HY-MT1.5:腾讯混元开源的翻译模型,支持33种国际语言互译及5种民汉/方言翻译
Tencent-HY-MT1.5:腾讯混元开源的翻译模型,支持33种国际语言互译及5种民汉/方言翻译

Tencent-HY-MT1.5是腾讯混元开源的翻译模型,包含两个版本Tencent-HY-MT1.5-1.8B 和 Tencent-HY-MT1.5-7B,支持33种国际语言互译及5种民汉/方言翻译,覆盖多种小语种。

混元大模型翻译大模型腾讯AI
PersonaLive:澳门大学和GVC实验室开源的实时数字人直播工具
PersonaLive:澳门大学和GVC实验室开源的实时数字人直播工具

PersonaLive是澳门大学和GVC实验室开源的实时数字人直播工具,能在单张12GB显存的消费级显卡上运行,实现无限时长的肖像动画生成,支持低延迟互动。

GVC实验室数字人直播澳门大学
Doubao-Seed-Code:一款火山引擎开发的豆包编程模型,支持端到端完成编码、调试、修复全流程任务

Doubao-Seed-Code是火山引擎发布的豆包编程模型,作为国内首个“视觉理解+长上下文+低成本”三位一体的代码大模型,它重新定义了AI辅助编程的效率与边界。

AI编程模型字节跳动火山引擎
TurboDiffusion:一款清华、加州大学联合推出的视频生成加速框架
TurboDiffusion:一款清华、加州大学联合推出的视频生成加速框架

TurboDiffusion是由清华大学、生数科技与加州大学伯克利分校联合研发的重磅视频生成加速框架,凭借多项核心技术突破,实现视频生成效率的跨越式提升。框架创新性融合SageAttention、SLA(稀疏线性注意力)与rCM(时间步蒸馏

加州大学清华大学生数科技
MedASR模型:Google推出的一款专注于医学领域的语音识别模型

MedASR支持根据特定医疗场景需求进一步微调优化。通过将医学语音高效转化为结构化文本,MedASR为医疗领域数字化应用搭建核心技术支撑,助力提升医疗服务效率与智能化水平。

AI医学助手语音识别模型谷歌AI
Kairos开悟世界模型3.0:大晓机器人推出的开源具身智能世界模型
Kairos开悟世界模型3.0:大晓机器人推出的开源具身智能世界模型

Kairos 3.0是开源的高效世界基础模型,专注于学习真实世界的动态、因果关系和物理规律,通过长时序视频生成实现对世界的理解和预测。

AI开源模型机器人框架
VTP预训练框架:一款MiniMax视频团队开源的视觉生成模型

VTP是MiniMax 视频团队研发的开源视觉生成模型预训练框架,核心聚焦视觉tokenizer的深度优化,通过融合对比学习、自监督学习与重建学习等多元训练范式,从头预训练出更具结构化、易学性的latent表示。

MiniMax视频视觉生成模型预训练框架
山海大模型:一款通过文本、音频、图像等与用户进行实时互动的多模态AI大模型

山海大模型是云知声公司推出的一款多模态AI大模型,具备丰富的知识储备和强大的多模态交互能力。它能够通过文本、音频、图像等多种形式与用户进行实时互动,提供信息查询、知识学习、灵感激发等服务。

AI大模型AI生成内容内容创作辅助
SHARP:苹果开源AI模型,1秒实现单图到逼真3D场景的极速转换
SHARP:苹果开源AI模型,1秒实现单图到逼真3D场景的极速转换

SHARP是苹果推出的开源AI模型,专注于单张2D照片到3D场景的高效生成,为VR/AR、影视制作、文物保护等领域提供低成本、高效率的3D建模解决方案。

3D场景生成AI模型苹果开源
SAM Audio:Meta开源多模态音频分割模型,精准分离复杂声音场景
SAM Audio:Meta开源多模态音频分割模型,精准分离复杂声音场景

SAM Audio是Meta开源的音频分割模型,能通过文本、视觉和时间片段等多模态提示,从复杂的音频混合中分离出特定的声音。

Meta AI音频分割模型
TRELLIS.2:微软开源4B参数图像到3D生成模型,高效产出高保真3D资产
TRELLIS.2:微软开源4B参数图像到3D生成模型,高效产出高保真3D资产

TRELLIS.2支持完整PBR材质建模,在NVIDIA H100 GPU上3秒即可生成512³分辨率模型,最高支持1536³超高清输出,同时提供GLB标准格式导出,为游戏、影视、工业设计等领域提供低成本、高效率的3D内容创作解决方案。

3D生成模型微软AI微软开源模型
Paper2Slides:港大开源的AI工具,快速将学术论文、报告和文档转换为PPT
Paper2Slides:港大开源的AI工具,快速将学术论文、报告和文档转换为PPT

支持PDF、Word、Excel、PowerPoint、Markdown等多种文件格式,能精准捕获关键见解、图表和数据点。用户可以选择内置的专业主题,也可以用自然语言描述来生成自定义样式。

AI工具助手PPT制作工具香港大学
Trae:新一代免费的AI编程工具