web建站教程
     
  1. 首页
  2. 前端UI组件库
  3. AI项目和框架
  4. 前端知识
  5. AI应用
  6. IT知识
  7. Chrome插件
  8. 地图大全
  9. 休息站

AI项目和框架

ERNIE-4.5-VL:百度文心推出基于ERNIE-4.5-VL-28B-A3B的开源多模态AI模型
ERNIE-4.5-VL:百度文心推出基于ERNIE-4.5-VL-28B-A3B的开源多模态AI模型

的新一代

多模态AI模型百度开源百度文心
GPT-5.1:OpenAI推出的GPT-5系列AI智能升级版本
GPT-5.1:OpenAI推出的GPT-5系列AI智能升级版本

GPT-5.1是OpenAI对GPT-5系列的迭代升级版本,该模型包含两个差异化版本:GPT-5.1Instant和GPT-5.1Thinking。其中Instant版本更温暖自然,适配日常对话场景,能精准遵循指令并输出有趣回答。

AI模型OpenAI
OpenNof1:开源AI自主交易系统,兼容OpenAI、DeepSeek等
OpenNof1:开源AI自主交易系统,兼容OpenAI、DeepSeek等

OpenNof1是一款开源 AI 自主交易系统,系统兼容OpenAI、DeepSeek等主流AI提供商,可对接币安合约等交易平台,通过实时市场数据处理与极简交互界面,实现交易决策的智能化、交易监控的实时化。

AI实时交易AI提供商AI自主交易系统
SIMA 2:谷歌DeepMind研发的最新一代跨环境3D智能体
SIMA 2:谷歌DeepMind研发的最新一代跨环境3D智能体

SIMA 2实现了数据自驱动的高效学习——70%训练数据由Gemini自动生成,通过试错与反馈持续迭代能力;同时具备极强的环境泛化性,可在未经预训练的全新游戏中快速适配任务,端到端响应时间压缩至200毫秒以内,完美适配实时交互场景需求。

3D智能体AI智能体Google DeepMind谷歌开源
SenseNova-SI:商汤推出的开源空间智能大模型,专注于提升空间智能
SenseNova-SI:商汤推出的开源空间智能大模型,专注于提升空间智能

SenseNova-SI是商汤推出的开源空间智能大模型,该模型依托大规模、高质量的空间数据完成训练,在空间测量、空间关系理解、多视角转换等核心维度实现性能突破,不仅超越同量级开源模型,更在多个权威基准测试中领先于GPT-5等顶尖闭源模型。

商汤开源商汤科技空间智能大模型
Omnilingual ASR:Meta AI推出的千亿级语言自动语音识别系统
Omnilingual ASR:Meta AI推出的千亿级语言自动语音识别系统

Omnilingual ASR采用社区驱动的扩展框架,用户仅需提供少量语音-文本样本,即可快速将系统适配至新语言;同时 Meta 开源了Omnilingual ASR Corpus数据集与全新自监督式大规模多语言语音表示模型Omnilingual wav2vec 2.0,为全球语音技术研发提供核心支撑,助力推动语言平等与跨文化交流。

Meta AI语音识别系统
DeepEyesV2:小红书团队研发推出的多模态智能体模型
DeepEyesV2:小红书团队研发推出的多模态智能体模型

DeepEyesV2模型训练分为两个核心阶段:第一阶段通过监督微调,帮助模型建立工具使用的基础认知;第二阶段借助强化学习,大幅提升工具调用效率与场景泛化能力。

小红书开源智能体模型
LazyCraft:基于开源框架LazyLLM构建的AI Agent应用开发与管理平台
LazyCraft:基于开源框架LazyLLM构建的AI Agent应用开发与管理平台

LazyCraft是商汤基于开源框架LazyLLM打造的一站式AI Agent应用开发与管理平台,平台提供从应用创建、调试、发布到监控的全流程闭环能力,支持低代码拖拽式开发与组件化应用编排。

AI AgentAI模型评测LazyLLM
讯飞星火X1.5:科大讯飞推出的基于全国产算力平台的深度推理大模型
讯飞星火X1.5:科大讯飞推出的基于全国产算力平台的深度推理大模型

讯飞星火X1.5是科大讯飞推出的基于全国产算力平台的深度推理大模型,该模型在语言理解、文本生成、知识问答、逻辑推理、数学运算、代码开发等核心领域全面对标国际主流大模型,其中数学能力保持国际领先水平。

AI星火大模型推理大模型科大讯飞
UNO-Bench:美团LongCat团队研发全模态大模型的标准化评测基准
UNO-Bench:美团LongCat团队研发全模态大模型的标准化评测基准

UNO-Bench是美团LongCat团队研发的全模态大模型专业评测基准。针对现有评测体系在多模态能力评估上的局限性,该基准依托高质量、多样化的数据集构建,可精准衡量模型的单模态性能与全模态融合能力。

AI模型评测全模态大模型美团LongCat
Kosmos:FutureHouse自动化科研的新一代AI科学家

Kosmos是由FutureHouse研发的新一代AI科学家,该系统创新性采用结构化世界模型,具备海量信息高效整合与大规模任务并行处理能力,单次运行可解析1500篇学术论文、执行42000行分析代码,数据处理规模远超同类智能体系统。

AI科学家FutureHouse
Kimi-k2 Thinking:月之暗面推出的新一代通用智能体模型
Kimi-k2 Thinking:月之暗面推出的新一代通用智能体模型

Kimi-k2 Thinking是月之暗面推出的新一代通用智能体模型,具备领先的Agentic自主能力与深度推理能力。该模型可实现多轮自主思考与工具调用,无需人工干预即可完成复杂任务的规划与执行,尤其适用于需要分步拆解、逻辑推演的高难度场景。

Kimi人工智能模型月之暗面
Open-o3 Video:北京大学与字节跳动联合研发的开源视频推理模型
Open-o3 Video:北京大学与字节跳动联合研发的开源视频推理模型

Open-o3 Video是北京大学与字节跳动联合研发的开源视频推理模型,核心突破在于通过整合关键时间戳、边界框等显式时空证据,实现对视频内容的精准推理。

北京大学字节跳动视频推理模型
OmniVinci:NVIDIA推出专门处理视觉/听觉/语言的全模态大语言模型
OmniVinci:NVIDIA推出专门处理视觉/听觉/语言的全模态大语言模型

OmniVinci是NVIDIA推出的新一代全模态大语言模型,专注于视觉、听觉、语言与推理的跨模态协同任务。该模型依托独创的`OmniAlignNet`跨模态语义对齐技术、`Temporal Embedding Grouping`时序同步机制与`Constrained Rotary Time Embedding`时间感知优化方案

nvidia全模态大语言模型
AI Research Foundations:DeepMind与UCL联合推出的免费在线课程
AI Research Foundations:DeepMind与UCL联合推出的免费在线课程

AI Research Foundations是Google DeepMind与伦敦大学学院联合打造的免费在线课程,聚焦Transformer模型的核心原理与实践应用,旨在帮助学习者夯实AI研究基础,掌握现代语言模型的构建、训练与微调全流程技能。

AI研究基础课程Google DeepMind伦敦大学学院在线课程谷歌AI
扣子空间 – 免费全能AI办公智能体
Trae:新一代免费的AI编程工具