Qwen3-VL-Reranker是阿里通义基于 Qwen3-VL 架构打造的跨模态理解模型,专为多模态信息检索场景设计。模型可接收任意模态组合的查询与文档对(如图文查询匹配图文文档),通过单塔架构与交叉注意力机制深度解析语义关联,输出精准
Qwen3-VL-Embedding是阿里通义推出的多模态信息检索模型,专为文本、图像、可视化文档(图表 / 代码 / UI 组件等)、视频等多模态输入场景设计。

VoiceSculptor是由西北工业大学、语图智能联合推出的前沿音色设计模型,支持对音色的性别、年龄、语速、音调、音量及情感等核心属性进行灵活调校,并融合检索增强生成(RAG)技术强化复杂指令理解能力。
ChatDev 2.0是由清华大学、上海交通大学、OpenBMB、面壁智能联合团队开源的零代码多智能体工具,平台内置 Agent、Human、Python、Logic 等多种节点类型,可实现智能体间的高效协同。
EvoCUA通过自然语言指令和屏幕截图实现对Chrome、Excel、PowerPoint等软件的端到端多轮操作,显著提升计算机使用能力。

Youtu-LLM是腾讯优图团队开源的轻量级大模型,参数规模仅19.6亿,却凭借紧凑架构设计与创新训练范式,具备强大的原生智能体能力,在复杂任务处理中超越同规模甚至更大参数模型。模型支持128K超长上下文窗口,针对STEM领域深度优化词表,

UI-TARS Desktop是字节跳动开源的桌面自动化工具,基于视觉语言模型打造,支持通过自然语言指令控制电脑完成打开文件、浏览网页、操作软件等各类任务。

Open Interpreter是开源的AI终端助手项目,用户可以通过类似 ChatGPT 的方式在终端中与模型对话,完成各种任务。支持Python、JavaScript、Shell等语言的代码运行,能创建和编辑文件、控制浏览器进行研究、分析数据等。
Rubin是英伟达推出的新一代全栈协同AI芯片平台,包含六种芯片:Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9网卡、BlueField-4 DPU和Spectrum-6以太网交换机。

NIM(NVIDIA Inference Microservices)是英伟达推出的生成式AI推理加速微服务解决方案平台,专为快速部署和高效运行AI模型设计。平台提供预构建、深度优化的推理微服务,支持在云、数据中心、工作站、边缘设备等所有N
是中国电信人工智能研究院(TeleAI)自主研发的千亿参数细粒度 MoE(混合专家)语义大模型,采用国产算力训练,支持多轮对话、文本创作、代码生成等任务。
MiroThinker v1.5是MiroMind团队推出的开源搜索智能体模型,核心创新在于以交互式扩展技术打破传统大模型 “唯参数论” 的局限,实现推理能力与外部环境的深度耦合。

openPangu-VL-7B是华为推出的开源多模态大模型,深度适配昇腾硬件架构,融合强大的语言理解与视觉分析能力,兼具高精度视觉定位、智能OCR识别等核心功能,可高效处理图像、文档、短视频等多类型任务。

DLCM(动态大概念模型)是字节跳动 Seed 团队推出的新型大语言模型架构,核心突破在于将模型推理单位从传统的 token(词)层级,升级至concept(概念)层级。

StoryMem是字节跳动与南洋理工大学联合研发的开源多镜头视频生成框架,核心解决AI视频生成领域长期存在的跨镜头一致性痛点。它创新性地引入显式视觉记忆机制,将传统单镜头视频扩散模型升级为专业多镜头叙事工具;
