web建站教程
     
  1. 首页
  2. 前端UI组件库
  3. AI项目和框架
  4. AIGC工具
  5. 百度echarts
  6. 地图大全
  7. 前端知识
  8. 更多
    vuejs
    js入门
    php入门
    mysql
    wordpress
    织梦cms
    帝国cms
    git教程
    IT知识
    模板大全
    休息站
    AI应用

OCR模型

GLM-OCR:智谱AI开源轻量级多模态OCR模型0.9B参数登顶OmniDocBench SOTA
GLM-OCR:智谱AI开源轻量级多模态OCR模型0.9B参数登顶OmniDocBench SOTA

GLM-OCR是智谱AI开源的轻量级多模态OCR模型,模型基于GLM-V架构打造,集成智谱自研CogViT视觉编码器与轻量跨模态连接层,创新引入多Token预测损失和强化学习训练策略,在手写体、复杂表格、代码文档、印章、多语言混排等高难识别场景表现卓越。

GitHub仓库OCR模型多模态AI模型智谱AI
DeepSeek-OCR 2:DeepSeek团队推出的第二代高性能OCR模型

DeepSeek-OCR 2是DeepSeek团队推出的第二代高性能光学字符识别模型,模型搭载因果流查询与双流注意力核心机制,可动态重排视觉Token,精准还原复杂文档的自然阅读逻辑。

DeepSeek模型OCR模型
LightOnOCR-2-1B:LightOnAI推出的轻量级高效复杂文档OCR模型
LightOnOCR-2-1B:LightOnAI推出的轻量级高效复杂文档OCR模型

LightOnOCR-2-1B是LightOnAI推出的轻量级OCR模型,在学术论文、数学公式、复杂表格等复杂文档处理场景中表现卓越。该模型基于RLVR强化学习技术构建,可直接输出Markdown格式结构化文本,支持表格还原、公式识别与多栏布局处理。

LightOnAIOCR模型
Trae:新一代免费的AI编程工具