web建站教程
     
  1. 首页
  2. 前端UI组件库
  3. AI项目和框架
  4. 前端知识
  5. AI应用
  6. IT知识
  7. Chrome插件
  8. 地图大全
  9. 休息站

多模态推理AI

Phi-4-reasoning-vision-15B模型使用入口,微软推出的150亿参数开源多模态推理模型
Phi-4-reasoning-vision-15B模型使用入口,微软推出的150亿参数开源多模态推理模型

Phi-4-reasoning-vision-15B模型核心优势集中在GUI界面理解、数学科学推理、文档图表分析三大领域,推理速度较同类大模型快10倍以上,同时在AI2D、ChartQA、MathVista等权威基准测试中表现亮眼,展现出“小参数量、高性能、低延迟”的核心竞争力。

多模态推理AI微软开源模型
Codev GGUF视觉语言模型(基于Qwen2.5-VL-7B-Instruct微调)
Codev GGUF视觉语言模型(基于Qwen2.5-VL-7B-Instruct微调)

Codev GGUF是一款基于Qwen2.5-VL-7B-Instruct微调而成的70亿参数视觉语言模型,通过“监督微调(SFT)+ 基于工具感知策略优化(TAPO)的强化学习(RL)”两阶段精准训练,核心目标是实现可靠、可解释的视觉推理。

AI多模态模型AI强化学习优化AI视觉工具调用Transformers架构多模态推理AI
扣子空间 – 免费全能AI办公智能体
Trae:新一代免费的AI编程工具