web建站教程
     
  1. 首页
  2. 前端UI组件库
  3. AI项目和框架
  4. AIGC工具
  5. 百度echarts
  6. 地图大全
  7. 前端知识
  8. 更多
    vuejs
    js入门
    php入门
    mysql
    wordpress
    织梦cms
    帝国cms
    git教程
    IT知识
    模板大全
    休息站
    AI应用

xLLM:京东开源的国产芯片适配型高效智能推理框架

53 ℃

xLLM是京东自主研发并开源的高效智能推理框架,专为国产芯片深度优化,支持端云一体灵活部署。框架采用服务-引擎分离的解耦架构:服务层聚焦请求调度与容错管理,保障系统稳定性;引擎层专注底层运算性能优化,集成多流并行、计算图融合、动态负载均衡等核心特性。

xLLM:京东开源的国产芯片适配型高效智能推理框架

xLLM核心功能:

1、全图化多层流水线执行编排

从框架层异步解耦调度、模型图层计算通信异步并行,到算子内核层深度流水优化,构建全链路流水线执行体系,有效减少计算空泡,显著提升整体推理效率。

2、动态Shape的图执行优化

采用参数化与多图缓存方法实现动态输入尺寸适配,结合管控式显存池与自定义算子集成,在提升静态计算图灵活性的同时,保障显存安全复用,优化动态输入场景下的推理性能。

3、MoE模型算子专项优化

针对混合专家(MoE)模型架构,实现 GroupMatmul 与 Chunked Prefill 算子优化:前者提升大规模矩阵运算效率,后者强化长序列输入的处理能力,双向提升 MoE 模型推理性能。

4、高效显存智能管理

创新采用离散物理内存与连续虚拟内存映射管理机制,按需分配内存空间,智能调度内存页复用,减少内存碎片与分配延迟;深度适配国产芯片算子特性,大幅提升显存利用效率。

5、全局多级KV Cache管理

实现多级缓存的 KV 数据智能卸载与预取,构建以 KV Cache 为核心的分布式存储架构,优化多节点间 KV 数据的智能传输路由,兼顾缓存命中率与数据传输效率。

6、算法级性能优化

集成投机推理优化与 MoE 专家动态负载均衡策略,通过多核并行计算提升推理吞吐量,动态调整专家节点任务分配,实现算法层面的效率与负载均衡双优化。

xLLM快速上手指南:

1、环境准备

– 下载镜像:根据硬件设备(如 A2、A3 等)与架构(x86/ARM)选择对应 Docker 镜像。示例:A2 设备(x86 架构)可下载主镜像xllm/xllm-ai:0.6.0-dev-hb-rc2-x86;若下载失败,可使用备用源quay.io/jd_xllm/xllm-ai:0.6.0-dev-hb-rc2-x86

– 创建容器:启动容器时需挂载必要的硬件设备文件(如/dev/davinci0/dev/davinci_manager)、模型文件路径及驱动路径,确保容器可访问底层硬件资源与数据。

2、安装编译

– 安装依赖

1. 进入容器后,克隆 xLLM 官方仓库并初始化子模块。

2. 若镜像未预装 vcpkg,手动克隆 vcpkg 仓库并配置环境变量VCPKG_ROOT 指向其安装路径。

3. 基于清华大学 Python 镜像源,安装框架所需 Python 依赖,并升级setuptoolswheel 工具。

– 编译构建

1. 运行编译命令生成可执行文件,默认编译目标为 A2 设备;若需适配 A3、MLU 等其他设备,可通过添加编译参数指定设备类型。

2. 如需生成 Python 可用的 whl 包,执行对应编译命令,生成的包文件将自动存放至dist/ 目录。

3、模型加载与推理调用

– 模型准备:将待部署的模型文件存放至容器可访问的路径(如/mnt/cfs/9n-das-admin/llm_models)。

– 模型加载:调用 xLLM 提供的标准化接口,完成模型的加载与初始化。

– 推理调用:通过框架推理接口输入文本或多模态数据,即可获取模型推理结果,接口将根据加载的模型类型自动完成计算与结果返回。

xLLM典型应用场景:

1、智能客服

依托高效推理能力快速响应用户咨询,精准理解用户意图并输出解答,提升客服响应效率与客户满意度。

2、实时推荐

基于用户实时行为数据,快速完成个性化推荐计算,输出精准的商品、内容推荐结果,提高用户参与度与转化率。

3、内容生成

支持高质量文本内容创作,可应用于新闻撰写、营销文案生成、报告草拟等场景,助力内容生产提效。

4、多模态应用

适配文本-图像等多模态模型,可落地于图像描述生成、视觉问答(VQA)、跨模态内容检索等场景。

5、生成式推荐

融合生成式 AI 技术,突破传统推荐的内容形式限制,生成更具个性化与丰富度的推荐内容,升级用户体验。

xLLM项目GitHub仓库:https://github.com/jd-opensource

进入xLLM项目地址官网入口

相关阅读文章

京东AI购APP最新版

言犀AI数字人:支持100多个个性化角色,适用于50多个行业特定属性场景

小星绪:京东健康推出的一款AI情绪漫画生成应用小程序

JoyCode官网:京东云推出的新一代智能编程 AI IDE工具

Deco:京东推出的一款智能设计稿一键生成多端代码工具

标签: 京东AI 智能推理框架Trae AI编程工具

上面是“xLLM:京东开源的国产芯片适配型高效智能推理框架”的全面内容,想了解更多关于 AI项目和框架 内容,请继续关注web建站教程。

当前网址:https://ipkd.cn/webs_27560.html

声明:本站提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请发送到邮箱:admin@ipkd.cn,我们会在看到邮件的第一时间内为您处理!

当前位置: 首页 > AI项目和框架
Trae:新一代免费的AI编程工具

呱呱工具箱

一款免费的在线小工具,无需下载,打开即可使用!呱呱工具箱

在线育儿补贴计算器

快来看看你到底可以领到多少补贴!生活小工具
上一篇:
下一篇:
x 打工人ai神器