
5月29日,阶跃星辰发布面向生产级Agent的高效率模型Step 3.7 Flash,海光DCU完成Day0推理适配。Step 3.7 Flash是围绕Agent、编码、搜索与工作流系统优化的高效率模型,具备原生多模态理解、强化联网视觉搜索及高可靠工具调用编排能力,兼容主流Agent框架及MCP/Skills协议。
面对该模型对算力与多模态处理的严苛要求,海光DCU给出硬核技术支撑:原生支持FP8精度,较传统FP16大幅提升峰值性能,降低内存与通信开销,有效提升每Token能效比;大显存设计则为多模态长序列输入与工具调用状态缓存提供充裕空间,确保Agent多轮交互稳定流畅,避免显存不足致任务“跑偏”或中断。模型竞争进入高效智能阶段,海光以软硬件协同优势,提供“发布即适配、适配即高效”算力保障,赋能生产级智能体高质量落地。
“特别声明:以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布,本平台仅提供信息存储空间服务。
Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”