JoyAI-LLM-Flash是京东开源的中型指令大模型,模型创新性引入FiberPO优化框架——首次将纤维丛理论应用于强化学习,结合Muon优化器完成SFT、DPO及RL全阶段训练;同时搭载稠密多Token预测(MTP)技术,吞吐量较非MTP版本提升1.3-1.7倍。
LongCat-Flash-Thinking的核心突破在于系统性训练架构:通过多环境强化学习、抗噪课程训练和任务合成机制,使模型在不完美、高噪声的真实环境中仍能稳健运行。
织梦 栏目 dedecms建站 mysql语法 AI开源项目 GitHub仓库 CMS网站 php语法 调用 DeepSeek