
即梦AI(原名Dreamina)是由字节跳动旗下的剪映团队推出的一款一站式AI创作平台。其核心功能包括文生图(文字生成图像)、文/图生视频(文字或图片生成视频)以及智能画布等。

字节旗下AI代码助手程,国内首款原生AI IDE,它不仅提供智能代码生成、优化和调试功能,还通过多模态交互、上下文感知和跨语言支持等创新技术,帮助开发者高效完成项目开发。

QwenLong-L1.5是阿里通义实验室推出的长文本推理专用大语言模型,基于Qwen3-30B-A3B架构打造。通过系统化后训练方案,结合高质量数据合成管线、稳定强化学习方法与突破物理窗口限制的记忆管理框架。

MiniMax M2.1是MiniMax推出的新一代多语言编程AI模型。相较于前代MiniMax M2,该模型系统性强化Rust、Java、Golang等主流编程语言的支持能力,覆盖从底层系统开发到上层应用开发的全链路场景;同时增强Web与

Seed Prover 1.5是字节跳动Seed团队研发的新一代形式化数学推理模型,该模型创新性采用Agentic Prover架构,依托大规模强化学习(Agentic RL)完成训练,实现数学推理能力与效率的双重跃升。

GPT-5.2-Codex是OpenAI推出的智能体编程专用模型,专为复杂软件工程与防御性网络安全任务打造。该模型基于GPT-5.2架构升级迭代,强化指令遵循与长语境理解能力,在代码重构、跨环境迁移等大型工程变更任务中表现突出。

Gemini 3 Flash是谷歌推出的高速低成本前沿智能模型,基于Gemini 3架构迭代开发,兼具强劲推理性能与多模态理解能力。在多项权威基准测试中,该模型表现比肩甚至超越Gemini 3 Pro、GPT-5.2等更大规模模型。

Seedance 1.5 Pro是字节跳动Seed团队研发的原生音画同步多模态视频生成模型,支持通过文本指令生成高质量视频内容,覆盖多语言、多方言及多样人声与音效。

DeepSeek-Math-V2是DeepSeek团队推出的开源数学推理模型,模型聚焦答案正确性与推理过程严谨性,通过训练定理证明验证器与生成器,创新引入元验证机制,让模型能够像人类数学家一样审查证明逻辑、实现自我纠错。

StepAudio R1是阶跃星辰团队研发的全球首个开源原生音频推理模型,核心依托创新的模态锚定推理蒸馏(MGRD)框架,攻克传统音频模型在复杂推理任务中性能衰减的技术痛点,真正实现基于声学特征的深度推理。

GELab-Zero是阶跃星辰研发的开源GUI Agent模型,模型支持在消费级硬件上运行4B参数版本,兼顾低延迟响应与数据隐私保护;提供一键多终端部署能力,自动处理环境依赖与设备管理,兼容分布式任务编排及多模态Agent模式,可灵活应对复杂移动自动化任务。

Vidi2是字节跳动推出的专注于视频理解与创作的多模态大语言模型,模型可基于文本查询,精准识别视频对应时间戳并标记目标对象边界框,还创新引入VUE-STG、VUE-TR-V2两大基准测试,为STG能力评估提供更科学的标准。

可灵O1是可灵AI研发的全球首个统一多模态视频生成模型,模型支持图片、视频、文字等多模态输入,可一站式完成全能创作与编辑,精准解决视频生成中的主体一致性难题,解锁多元创意组合玩法。
Alpamayo-R1是英伟达研发的视觉-语言-动作模型,模型核心创新涵盖三大维度:构建因果链(CoC)高质量推理轨迹数据集、采用具备物理常识与具身推理能力的Cosmos-Reason作为VLM骨干网络、设计“监督微调+强化学习”多阶段训练策略。

HunyuanOCR是腾讯混元团队推出的开源端到端OCR视觉语言模型,其功能覆盖文本检测与识别、复杂文档解析、开放字段信息抽取、视频字幕抽取等经典OCR任务,同时支持端到端拍照翻译与文档问答,为多场景文本处理提供一站式解决方案。

ViMax是香港大学数据科学实验室研发的端到端多智能体视频生成框架,框架创新性整合导演、编剧、制片人及视频生成器的核心职能,支持Idea2Video、Novel2Video、Script2Video、AutoCameo四大生成模式。

Z-Image是阿里通义推出的6B参数轻量化图像生成模型,构建单流DiT架构核心底座,衍生出三大功能变体:Z-Image-Turbo、Z-Image-Base、Z-Image-Edit,精准匹配不同场景需求。
