Qwen3-Coder-Next是一款专为编程智能体与本地开发设计的开源权重语言模型。该模型基于 Qwen3-Next-80B-A3B-Base 构建,采用混合注意力与 MoE 的新架构;通过大规模可执行任务合成、环境交互与强化学习进行智能体训练,在显著降低推理成本的同时,获得了强大的编程与智能体能力。

Thinker模型聚焦机器人核心需求,打造任务规划、空间理解、时间推理、视觉定位四大核心能力,精准解决机器人“想得到但抓不准”的行业痛点。模型基于20亿原始数据精炼的1000万高质量数据训练,依托自动化标注体系将人工参与率控制在1%以下,兼顾训练效率与数据质量。

GLM-OCR是智谱AI开源的轻量级多模态OCR模型,模型基于GLM-V架构打造,集成智谱自研CogViT视觉编码器与轻量跨模态连接层,创新引入多Token预测损失和强化学习训练策略,在手写体、复杂表格、代码文档、印章、多语言混排等高难识别场景表现卓越。

支持生成10秒长、720p分辨率的高清视频,搭配显著优化的音频效果,体验更流畅沉浸。上线30天内,该工具已累计生成超过12.45亿条视频,在Artificial Analysis基准测试中表现优异,且xAI已开放API接口,方便开发者灵活接入使用。

Ultralytics是一款易用性极强的开源计算机视觉(CV)与深度学习框架,框架覆盖从数据准备到模型部署的全流程,兼具“高性能、易上手、多端适配”三大核心优势,广泛应用于工业、安防、智能驾驶等多领域场景。

FastBuildAI是一款面向AI开发者、创业者及AI兴趣群体的开源AI应用开发框架,通过可视化零代码界面,无需专业编程技能,几分钟即可完成部署并搭建出包含营销、计费、支付功能的完整AI应用,彻底降低AI应用开发门槛。

Step 3.5 Flash是阶跃星辰全新开源的基座模型,专为Agent智能体场景打造,采用稀疏MoE架构,实现性能与效率的双重兼顾:模型总参数达1960亿,推理时每token仅激活110亿参数,推理速度峰值高达350 TPS,同时支持256K超长上下文窗口,在数学推理、代码生成及各类Agent复杂任务中,性能媲美行业顶级闭源模型。

LFM2-2.6B-Exp通过强化学习的微调和创新的混合架构设计,实现了在2.6B参数规模下的高性能表现。它不仅在学术基准上取得了优异成绩,更重要的是,它提供了一套完整的边缘AI解决方案,极大降低了中小企业和个人开发者部署AI的门槛。

对于广大开发者而言,这一突破意味着将拥有更高效、更易用、高性价比的代码辅助工具,可大幅简化代码编写、调试、优化等流程,提升开发效率;对于整个行业来说,IQuest‑Coder‑V1系列的创新技术思路,或将为代码大模型的轻量化、高性能发展提供全新方向,推动开源代码模型在更多实际开发场景中落地应用。

Open Coding Agents项目是AI2首次推出一套完全开源、低成本、可复现的编码智能体方案。其核心模型SERA不仅在性能上处于行业领先水平,更具备极高的性价比。

LongCat-Flash-Thinking的核心突破在于系统性训练架构:通过多环境强化学习、抗噪课程训练和任务合成机制,使模型在不完美、高噪声的真实环境中仍能稳健运行。

Luma Ray3AI是由Luma Ray3打造的全球首个具备推理能力的视频模型,可通过智能思考、规划创作专业级视频内容,搭载原生HDR生成、智能草稿模式等核心能力,能深度理解创作需求、快速完成内容迭代。

Wan2.2 Animate支持精确面部表情控制、身体动作复制、无缝角色替换等核心能力,可在保留原始动作、环境背景、光照的前提下完成角色动画创作,无需注册、浏览器直连使用,适配学术研究、效果展示、创意实验等多元场景。

Vidu Q3是生数科技推出的全球首款16秒音画同步AI视频模型,专为短剧、漫剧、广告等叙事场景打造,一次提示即可直出1080p成片,画面、对白、环境音效与BGM全对齐,零后期即可使用。

UnifoLM-VLA-0是宇树科技开源的通用视觉-语言-动作(VLA)大模型,基于Qwen2.5-VL-7B架构完成持续预训练,核心通过融合2D/3D空间感知、轨迹预测等多维监督信号,实现从视觉语言理解到具身智能体的技术进化。