web建站教程
  1. 首页
  2. vuejs
  3. js
  4. 好玩
  5. AIGC工具
  6. 前端知识
  7. 百度echarts
  8. 更多
    php入门
    nodejs
    mockjs
    reactjs
    mysql
    wordpress
    织梦cms
    帝国cms
    git教程
    IT知识
    模板大全
    休息站
    手机应用

Tiny-R1-32B:一款由360公司与北京大学联合研发的中等量级推理模型

107 ℃

Tiny-R1-32B是由360公司与北京大学联合研发的中等量级推理模型,于2025年2月24日正式发布。该模型仅以32亿参数量,成功逼近了DeepSeek-R1-671B的满血性能,展现了小模型在高效推理领域的巨大潜力。

Tiny-R1-32B功能特点:

1、高效性能

数学领域:在AIME2024评测中,Tiny-R1-32B取得了78.1分的成绩,仅低于原版R1模型的79.8分,远超DeepSeek-R1-Distill-Llama-70B的70.0分。

编程领域:在LiveCodeBench测试中,Tiny-R1-32B取得了61.6分的成绩,领先于最佳开源70B模型。

科学领域:在GPQA-Diamond测试中,Tiny-R1-32B取得了65.0分的成绩,同样领先于最佳开源70B模型。

2、低推理成本

仅需5%的参数量,Tiny-R1-32B就实现了原版R1模型95%以上的性能,显著降低了推理成本。

3、技术创新

分治-融合策略:基于DeepSeek-R1生成海量领域数据,分别训练数学、编程、科学三大垂直领域的模型,随后通过Arcee团队的Mergekit工具进行智能融合,突破了单一模型的性能上限,实现了多任务的均衡优化。

4、开源精神

Tiny-R1-32B的训练代码和技术报告即将公开,助力AI社区共筑高效推理新生态。

Tiny-R1-32B应用场景:

1、智能终端:可部署在智能手机、平板电脑等设备上,提供高效的语音助手、图像识别等功能。

2、物联网:适用于智能家居、智能安防等场景,实现实时数据分析和智能决策。

3、医疗影像诊断:通过定制化训练,快速识别病变特征,辅助医生进行精准诊断。

4、金融风控:实时监测交易数据,及时发现异常行为,提高风险预警能力。

进入Tiny-R1-32B模型Hugging Face仓库官网入口

咕噜口语SpeakGuru

酷表ChatExcel

QwQ-Max-Preview:阿里巴巴基于Qwen2.5-Max的一款先进的AI推理模型

Qihoo-T2X:一款由360CVGroup开发的高效扩散变换器模型

标签: 360AI, AI推理模型, 北京大学

上面是“Tiny-R1-32B:一款由360公司与北京大学联合研发的中等量级推理模型”的全面内容,想了解更多关于 IT知识 内容,请继续关注web建站教程。

当前网址:https://ipkd.cn/webs_18082.html

声明:本站提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请发送到邮箱:admin@ipkd.cn,我们会在看到邮件的第一时间内为您处理!

当前位置: 网站首页 > IT知识
本文共计733个字,预计阅读时长5分钟

基金从业资格考试题库

一站式备考基金从业资格考试,收录2021-2025年模拟题库!呱呱工具箱

AI工作站

收录全球3800+ 款各行各业AI应用,轻轻松松做事!
生活小工具,收录了80多款小工具
上一篇: 推荐一款免费商用的斜体创意字体——字魂扁桃体
下一篇: 推荐一款充满古雅之风的免费字体——问藏书房字体
x 打工人ai神器