web建站教程
     
  1. 首页
  2. 前端UI组件库
  3. AI项目和框架
  4. 前端知识
  5. AI应用
  6. IT知识
  7. Chrome插件
  8. 地图大全
  9. 休息站

AI项目和框架

Lucy 2.0:Decart AI实时世界转换模型,重构高保真视觉编辑体验

Lucy 2.0能有效校正长期运行中的质量漂移问题,实现数小时不间断的连贯生成。针对AWS Trainium3硬件深度优化后,模型可广泛应用于实时角色替换、虚拟试装等视觉特效场景,同时为机器人训练提供物理一致的实时数据增强与模拟环境。

AI视频生成模型Decart AI
LingBot-Depth:专为攻克机器人在透明、反光物体场景的AI模型
LingBot-Depth:专为攻克机器人在透明、反光物体场景的AI模型

LingBot-Depth是蚂蚁灵波科技开源的高精度空间感知模型,该模型在深度补全、单目深度估计及机器人抓取等核心任务中表现卓越,可助力机器人精准理解三维环境,加速具身智能技术的落地应用。

空间感知模型蚂蚁灵波
Vidu Q2参考生Pro:一键复刻人物表情、复杂动作、特效画面等
Vidu Q2参考生Pro:一键复刻人物表情、复杂动作、特效画面等

Vidu Q2参考生Pro是全球首创的「万物可参考」生产级视频生成模型,创新性支持多模态素材输入,赋能创作者一键复刻人物表情、复杂动作、特效画面、场景氛围与纹理细节,实现视频内容的精细化编辑。

专业视频编辑智能美容美发视频生成模型
VO4 AI Video:无需专业编辑技能,即可轻松将文本、图像转化为高质量视频内容
VO4 AI Video:无需专业编辑技能,即可轻松将文本、图像转化为高质量视频内容

VO4 AI Video Generator是一款基于前沿AI技术打造的在线视频生成平台,无需专业编辑技能,即可轻松将文本、图像转化为高质量视频内容。

AI视频生成文本转视频
DeepSeek-OCR 2:DeepSeek团队推出的第二代高性能OCR模型

DeepSeek-OCR 2是DeepSeek团队推出的第二代高性能光学字符识别模型,模型搭载因果流查询与双流注意力核心机制,可动态重排视觉Token,精准还原复杂文档的自然阅读逻辑。

DeepSeek模型OCR模型
Kimi K2.5:月之暗面Kimi开源的全新一代全能旗舰多模态大模型
Kimi K2.5:月之暗面Kimi开源的全新一代全能旗舰多模态大模型

Kimi K2.5是月之暗面开源的全新一代全能旗舰多模态大模型,基于约15T视觉与文本混合数据训练打造,兼具顶尖的代码生成、视觉理解能力,创新性支持自主Agent集群协作机制,可调度多达100个子Agent并行处理复杂任务,实现执行效率的量级提升。

Kimi全能旗舰模型月之暗面
Loamly:专为解决传统分析工具无法精准识别AI来源流量的分析平台
Loamly:专为解决传统分析工具无法精准识别AI来源流量的分析平台

Loamly是一款开源网站流量分析平台,专注解决传统分析工具无法精准识别AI来源流量的行业痛点,助力企业清晰掌握生成式AI为业务带来的流量价值。

AI网站流量分析开源分析工具
SoraX:一款依托Sora 2核心技术打造的AI视频生成平台
SoraX:一款依托Sora 2核心技术打造的AI视频生成平台

SoraX平台支持文本、图像一键生成专业级高质量视频,兼具操作简易、性价比高的优势,还配备免费额度降低试用门槛,凭借强大的技术支撑与灵活的创作模式,成为快速产出优质视频内容的得力工具。

AI视频生成Sora
WeryAI:整合Kling、Sora、Flux等模型于一体的AI创意创作平台
WeryAI:整合Kling、Sora、Flux等模型于一体的AI创意创作平台

WeryAI是一款一体化AI创意创作平台,深度整合Kling、Google Veo、Sora、Flux等全球顶尖AI模型,打造 “一站式” 创作工作台。用户无需在多个平台间切换,即可畅享多类型 AI 创作服务。

AI图像生成AI视频生成
白虎-VTouch:一个跨本体视触觉多模态的机器人操作数据集
白虎-VTouch:一个跨本体视触觉多模态的机器人操作数据集

白虎-VTouch是国家地方共建人形机器人创新中心联合纬钛机器人开源的全球首个最大规模跨本体视触觉多模态数据集,涵盖视触觉传感器数据、RGB-D数据、关节位姿数据等多维度信息,覆盖轮臂机器人、双足机器人等多种机器人本体构型,累计数据规模超6万分钟。

人形机器人多模态数据集
TensorRT LLM:专为NVIDIA GPU量身打造的推理性能优化框架
TensorRT LLM:专为NVIDIA GPU量身打造的推理性能优化框架

TensorRT LLM是NVIDIA推出的大型语言模型(LLM)推理性能优化框架,专为NVIDIA GPU量身打造,基于PyTorch架构构建,提供简洁易用的Python API,可无缝适配从单GPU轻量部署到大规模分布式集群推理的全场景需求。

AI推理架构nvidiaNVIDIA开源
Qwen3-Max-Thinking:阿里千问系列全新推出的旗舰级推理大模型

Qwen3-Max-Thinking模型大幅强化原生Agent能力,可自适应自主调用工具,输出更智能、流畅且精准的回答。目前开发者与普通用户可通过Qwen Chat、千问PC端及网页端免费体验,企业可通过阿里云百炼获取专属API服务,千问APP也即将完成新模型接入。

AI推理模型通义千问阿里通义
Veo 3.2:一款增强型AI视频生成模型,高质量动态视频
Veo 3.2:一款增强型AI视频生成模型,高质量动态视频

Veo 3.2是一款增强型AI视频生成模型,该模型凭借角色与场景一致性、原生竖屏支持、4K超分等核心优势,大幅降低专业视频制作门槛,无论是业余爱好者还是专业创作者,都能高效实现创意落地。

AI视频生成模型
vLLM:加州大学伯克利分校开源的高性能大语言模型推理与部署框架
vLLM:加州大学伯克利分校开源的高性能大语言模型推理与部署框架

vLLM是加州大学伯克利分校 Sky Computing Lab 开源的高性能大语言模型(LLM)推理与部署框架,核心目标是为用户提供低延迟、高吞吐量、低成本的大模型服务。

加州大学智能推理框架
SGLang:一款面向大语言模型与多模态模型的开源高性能推理框架
SGLang:一款面向大语言模型与多模态模型的开源高性能推理框架

SGLang是一款面向大语言模型与多模态模型的开源高性能推理框架,该框架兼容Llama、Qwen、DeepSeek等主流模型及NVIDIA、AMD GPU、CPU、TPU等多类硬件平台,依托先进的推理优化技术与活跃社区支持,助力大模型高效落地于各类实际应用场景。

智能推理框架
扣子空间 – 免费全能AI办公智能体
Trae:新一代免费的AI编程工具