web建站教程
     
  1. 首页
  2. 前端UI组件库
  3. AI项目和框架
  4. 前端知识
  5. AI应用
  6. IT知识
  7. ComfyUI插件
  8. 地图大全
  9. 休息站

OCR模型

GLM-OCR:智谱AI开源轻量级多模态OCR模型0.9B参数登顶OmniDocBench SOTA
GLM-OCR:智谱AI开源轻量级多模态OCR模型0.9B参数登顶OmniDocBench SOTA

GLM-OCR是智谱AI开源的轻量级多模态OCR模型,模型基于GLM-V架构打造,集成智谱自研CogViT视觉编码器与轻量跨模态连接层,创新引入多Token预测损失和强化学习训练策略,在手写体、复杂表格、代码文档、印章、多语言混排等高难识别场景表现卓越。

GitHub仓库OCR模型多模态AI模型智谱AI
豆包网页版支持AI聊天,AI图片生成,AI漫画生成,AI写作等
[推荐] 豆包网页版:支持AI聊天,AI图片生成,AI漫画生成,AI写作等

字节跳动开发的一款多功能人工智能工具,基于云雀模型(豆包大模型)构建。它不仅是一个AI聊天机器人,还具备多种功能,包括写作助手、英语学习助手、音乐生成、编程助理等。

AI写作平台AI图片生成AI漫画生成工具AI聊天助手
DeepSeek-OCR 2:DeepSeek团队推出的第二代高性能OCR模型

DeepSeek-OCR 2是DeepSeek团队推出的第二代高性能光学字符识别模型,模型搭载因果流查询与双流注意力核心机制,可动态重排视觉Token,精准还原复杂文档的自然阅读逻辑。

DeepSeek模型OCR模型
LightOnOCR-2-1B:LightOnAI推出的轻量级高效复杂文档OCR模型
LightOnOCR-2-1B:LightOnAI推出的轻量级高效复杂文档OCR模型

LightOnOCR-2-1B是LightOnAI推出的轻量级OCR模型,在学术论文、数学公式、复杂表格等复杂文档处理场景中表现卓越。该模型基于RLVR强化学习技术构建,可直接输出Markdown格式结构化文本,支持表格还原、公式识别与多栏布局处理。

LightOnAIOCR模型
扣子空间 – 免费全能AI办公智能体
Trae:新一代免费的AI编程工具