Step 3.5 Flash是阶跃星辰全新开源的基座模型,专为Agent智能体场景打造,采用稀疏MoE架构,实现性能与效率的双重兼顾:模型总参数达1960亿,推理时每token仅激活110亿参数,推理速度峰值高达350 TPS,同时支持256K超长上下文窗口,在数学推理、代码生成(SWE-bench Verified通过率74.4%)及各类Agent复杂任务中,性能媲美行业顶级闭源模型。目前该模型已全面开源,兼容vLLM、SGLang、llama.cpp等主流框架,可在Mac Studio M4 Max、NVIDIA DGX Spark等消费级硬件完成本地部署,实现数据隐私保护与高性能推理的兼得。

Step 3.5 Flash核心功能:
1、高速推理响应:
基于MTP-3技术实现350 TPS峰值生成速度,可快速响应复杂多步推理需求,典型场景生成速度达100-300 tok/s,大幅降低解码延迟;
2、强适配Agent任务:
专为智能体场景设计,长链条复杂任务处理能力突出,SWE-bench Verified通过率达74.4%;
3、高效长文本处理:
支持256K超大上下文窗口,搭载混合注意力机制,在长文本场景下有效降低计算开销,兼顾处理效率与内容理解深度;
4、全端本地部署:
针对消费级硬件做深度优化,可在Mac Studio M4 Max、NVIDIA DGX Spark等设备流畅运行,适配私有化部署需求;
5、专业代码生成:
具备强大的编程与工具调用能力,支持代码自动生成、调试及结构化推理输出,可高效处理各类软件工程任务。
Step 3.5 Flash核心技术原理:
1、稀疏MoE架构:平衡大模型能力与推理成本
模型基于45层Transformer骨干网络搭建,每层配置288个细粒度路由专家+1个共享专家,推理阶段仅激活Top-8专家,使每token实际计算参数仅110亿,在保留1960亿大模型核心能力的同时,大幅降低推理成本,实现大模型规模与小模型推理效率的最优平衡。
2、MTP-3多Token预测:突破推理速度瓶颈
由滑动窗口注意力机制+密集前馈网络组成专用预测头,支持单次前向传播并行生成4个token,将典型场景生成速度提升至100-300 tok/s,峰值可达350 tok/s,显著缩短解码耗时,满足实时交互类场景的低延迟需求。
3、混合注意力机制:高效支撑256K长上下文
采用3:1滑动窗口注意力与全局注意力层交替的架构设计:滑动窗口层聚焦局部上下文信息,全局注意力层精准捕捉长距离语义依赖,在256K超长文本处理场景下,有效控制计算复杂度,兼顾长文本理解能力与推理效率。
4、多维度推理优化策略:适配规模化部署
支持专家并行(EP8)与张量并行(TP8)组合部署,搭配FP8量化技术大幅降低显存带宽压力;通过投机解码与MTP-3技术协同优化,可在Hopper GPU上实现高效服务化部署;同时针对消费级硬件做专项适配,为本地私有化部署提供技术支撑。
Step 3.5 Flash核心应用场景:
1、智能编程开发:
可作为Claude Code、Codex等工具的底层模型,提供代码生成、自动调试、软件工程全流程任务处理能力,SWE-bench Verified 74.4%的高通过率保障专业编程需求;
2、自主智能体执行:
适配深度学术研究、全网网页信息检索、跨平台多源数据对比等长链条推理Agent场景,可高效处理多步骤、高复杂度的智能体任务;
3、实时对话交互:
依托100-350 TPS的高速生成能力,为低延迟聊天机器人、在线教育实时辅导、企业智能客服等需要即时响应的交互类应用提供核心支撑;
4、长文本分析处理:
可高效完成学术论文深度研读、法律合同全本审查、大型代码库整体理解等任务,精准提取并整合海量长文本中的关键信息,提升长文本处理效率;
5、端侧隐私计算:
支持Mac Studio M4 Max、NVIDIA DGX Spark等本地设备部署,无需上传数据至云端,完美满足金融风控、医疗数据处理、企业核心文档分析等敏感数据私有化处理需求,实现数据安全与高性能计算的双重保障。
HuggingFace模型库:https://huggingface.co/stepfun-ai/Step-3.5-Flash
相关阅读文章
BaseHub Forums:开发者专属开源代码问答论坛,AI代理解析源码
GitHub Store:一个面向GitHub Releases的跨平台应用商店
Lobe官网:微软开发的免费机器学习工具(附GitHub仓库地址)
上面是“Step 3.5 Flash:阶跃星辰开源Agent场景专用稀疏MoE基座模型”的全面内容,想了解更多关于 AI项目和框架 内容,请继续关注web建站教程。
当前网址:https://ipkd.cn/webs_29857.html
Step 3.5 Flash(官网) 打不开万能教程:
1、微信/QQ内打不开:
把链接复制到系统浏览器再访问,微信/QQ内置页常自动拦截第三方站。
2、浏览器报“违规”:
部分国产浏览器的误拦截,换用系统原生浏览器即可:iPhone→Safari,安卓→Edge、Alook、X、Via 等轻量浏览器,均不会误屏蔽。
3、网络加载慢或空白:
先切换 4G/5G 与 Wi-Fi 对比;可以尝试使用网络加速器,将网络切换至更稳定的运营商。另外,部分网站可能需要科学上网才能访问,如Google、Hugging Face等一些国外服务器的网站(不推荐)。
workflows工作流
一个男人正走进科幻的大门ComfyUI工作流
一个黄色的海绵宝宝ComfyUI工作流
金属埃及人ComfyUI工作流
一只可爱的快乐老鼠戴着帽子ComfyUI工作流
王家卫电视剧繁花海报效果comfyui工作流
一盒用五颜六色的食材烹制的热气腾腾的寿司
一朵由琥珀制成的孤独美丽的玫瑰
金色玫瑰花comfyui工作流
猜你喜欢
声明:本站提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请发送到邮箱:admin@ipkd.cn,我们会在看到邮件的第一时间内为您处理!

css3实现星球旋转
日历设置每个月颜色都不一样
利用CSS3代码编写45款按钮效果
css3结合svg做一个动态广告
3d文字360度旋转
canvas经线动画走到效果
HTML5 Canvas 刻度尺
js实现table表格动态新增行和列表














