DeepSeek-OCR 2是DeepSeek团队推出的第二代高性能光学字符识别模型,模型搭载因果流查询与双流注意力核心机制,可动态重排视觉Token,精准还原复杂文档的自然阅读逻辑。

Model1是DeepSeek在FlashMLA代码库中披露的神秘模型,该模型在技术架构上实现多重突破:回归512维标准架构、深度适配NVIDIA Blackwell架构,创新引入Token级稀疏MLA、VVPA等核心机制,在性能优化、长文本处理能力与硬件适配性上实现质的跃升。

DeepSeek-Math-V2是DeepSeek团队推出的开源数学推理模型,模型聚焦答案正确性与推理过程严谨性,通过训练定理证明验证器与生成器,创新引入元验证机制,让模型能够像人类数学家一样审查证明逻辑、实现自我纠错。

DeepSeek-OCR是DeepSeek团队研发的一款视觉语言模型,主打基于视觉压缩技术的长文本高效处理能力。该模型采用DeepEncoder编码器+DeepSeek3B-MoE解码器的架构,可在保留高分辨率输入信息的前提下,大幅降低激活内存占用与视觉标记数量。

DeepSeek-R1-Safe是浙江大学网络空间安全学院与华为联合研发的安全专项大模型,基于DeepSeek系列模型迭代升级,深度适配华为昇腾芯片与MindSpeedLLM框架,构建起“安全语料构建—安全监督训练—强化学习优化”的全链路技术体系。

DeepSeek-V3.1-Terminus是DeepSeek团队推出的新一代人工智能语言模型,作为DeepSeek-V3.1的重磅升级版本,该模型聚焦语言一致性优化与Agent能力强化两大核心方向,精准解决中英文混杂、异常字符干扰等行业痛点,实现输出内容的规范性与稳定性双重跃升。
