web建站教程
     
  1. 首页
  2. 前端UI组件库
  3. AI项目和框架
  4. AIGC工具
  5. 百度echarts
  6. 地图大全
  7. 前端知识
  8. 更多
    vuejs
    js入门
    php入门
    mysql
    wordpress
    织梦cms
    帝国cms
    git教程
    IT知识
    模板大全
    休息站
    AI应用

AI项目和框架

Qwen3-VL-Reranker:阿里通义跨模态重排序模型,精准提升检索结果质量

Qwen3-VL-Reranker是阿里通义基于 Qwen3-VL 架构打造的跨模态理解模型,专为多模态信息检索场景设计。模型可接收任意模态组合的查询与文档对(如图文查询匹配图文文档),通过单塔架构与交叉注意力机制深度解析语义关联,输出精准

Qwen3-VLQwen3基础架构阿里通义
Qwen3-VL-Embedding:阿里通义多模态检索模型,专为处理文本、图像、可视化文档和视频等多种模态输入而设计

Qwen3-VL-Embedding是阿里通义推出的多模态信息检索模型,专为文本、图像、可视化文档(图表 / 代码 / UI 组件等)、视频等多模态输入场景设计。

Qwen3-VLQwen3基础架构检索模型阿里通义
VoiceSculptor:西北工业大学、语图智能等机构推出的音色设计模型
VoiceSculptor:西北工业大学、语图智能等机构推出的音色设计模型

VoiceSculptor是由西北工业大学、语图智能联合推出的前沿音色设计模型,支持对音色的性别、年龄、语速、音调、音量及情感等核心属性进行灵活调校,并融合检索增强生成(RAG)技术强化复杂指令理解能力。

西北工业大学语图智能
ChatDev 2.0:零代码多智能体协作平台,重构复杂任务自动化范式

ChatDev 2.0是由清华大学、上海交通大学、OpenBMB、面壁智能联合团队开源的零代码多智能体工具,平台内置 Agent、Human、Python、Logic 等多种节点类型,可实现智能体间的高效协同。

AI协作平台零代码搭建
EvoCUA:美团开源多模态计算机自动化模型,自然语言驱动软件智能操作

EvoCUA通过自然语言指令和屏幕截图实现对Chrome、Excel、PowerPoint等软件的端到端多轮操作,显著提升计算机使用能力。

AI自动化工具美团AI
Youtu-LLM:腾讯Youtu开源轻量级智能体专用大模型
Youtu-LLM:腾讯Youtu开源轻量级智能体专用大模型

Youtu-LLM是腾讯优图团队开源的轻量级大模型,参数规模仅19.6亿,却凭借紧凑架构设计与创新训练范式,具备强大的原生智能体能力,在复杂任务处理中超越同规模甚至更大参数模型。模型支持128K超长上下文窗口,针对STEM领域深度优化词表,

腾讯AI轻量级语言模型
UI-TARS Desktop:字节跳动开源视觉语言桌面自动化工具
UI-TARS Desktop:字节跳动开源视觉语言桌面自动化工具

UI-TARS Desktop是字节跳动开源的桌面自动化工具,基于视觉语言模型打造,支持通过自然语言指令控制电脑完成打开文件、浏览网页、操作软件等各类任务。

GUI智能体字节跳动桌面AI
Open Interpreter:开源AI终端助手,自然语言驱动本地代码运行
Open Interpreter:开源AI终端助手,自然语言驱动本地代码运行

Open Interpreter是开源的AI终端助手项目,用户可以通过类似 ChatGPT 的方式在终端中与模型对话,完成各种任务。支持Python、JavaScript、Shell等语言的代码运行,能创建和编辑文件、控制浏览器进行研究、分析数据等。

AI终端助手大型语言模型
Rubin AI计算平台:英伟达新一代AI芯片平台,重塑工业级AI计算范式

Rubin是英伟达推出的新一代全栈协同AI芯片平台,包含六种芯片:Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9网卡、BlueField-4 DPU和Spectrum-6以太网交换机。

AI芯片平台AI计算平台英伟达
NIM AI模型:英伟达生成式AI推理加速平台,赋能企业级AI快速落地
NIM AI模型:英伟达生成式AI推理加速平台,赋能企业级AI快速落地

NIM(NVIDIA Inference Microservices)是英伟达推出的生成式AI推理加速微服务解决方案平台,专为快速部署和高效运行AI模型设计。平台提供预构建、深度优化的推理微服务,支持在云、数据中心、工作站、边缘设备等所有N

AI推理模型企业级AI英伟达
TeleChat3:中国电信自主研发千亿级细粒度MoE语义大模型

是中国电信人工智能研究院(TeleAI)自主研发的千亿参数细粒度 MoE(混合专家)语义大模型,采用国产算力训练,支持多轮对话、文本创作、代码生成等任务。

中国电信人工智能研究院语义大模型
MiroThinker v1.5:MiroMind开源搜索智能体模型,轻量级参数实现高效精准推理

MiroThinker v1.5是MiroMind团队推出的开源搜索智能体模型,核心创新在于以交互式扩展技术打破传统大模型 “唯参数论” 的局限,实现推理能力与外部环境的深度耦合。

MiroMind多智能体框架
openPangu-VL-7B:华为开源昇腾原生多模态大模型,端侧高效处理视觉语言任务
openPangu-VL-7B:华为开源昇腾原生多模态大模型,端侧高效处理视觉语言任务

openPangu-VL-7B是华为推出的开源多模态大模型,深度适配昇腾硬件架构,融合强大的语言理解与视觉分析能力,兼具高精度视觉定位、智能OCR识别等核心功能,可高效处理图像、文档、短视频等多类型任务。

AI多模态模型华为AI
DLCM官网:字节Seed团队新一代大语言模型架构
DLCM官网:字节Seed团队新一代大语言模型架构

DLCM(动态大概念模型)是字节跳动 Seed 团队推出的新型大语言模型架构,核心突破在于将模型推理单位从传统的 token(词)层级,升级至concept(概念)层级。

AI大语言模型字节跳动框架
StoryMem:字节跳动与南洋理工大学联合发布的开源视频生成框架
StoryMem:字节跳动与南洋理工大学联合发布的开源视频生成框架

StoryMem是字节跳动与南洋理工大学联合研发的开源多镜头视频生成框架,核心解决AI视频生成领域长期存在的跨镜头一致性痛点。它创新性地引入显式视觉记忆机制,将传统单镜头视频扩散模型升级为专业多镜头叙事工具;

南洋理工大学字节跳动框架视频生成框架
Trae:新一代免费的AI编程工具