从IO500双榜第一,看国产存储的系统级突破

发布时间:2026/7/1 2:26:42
从IO500双榜第一,看国产存储的系统级突破 作者王聪彬中国存储厂商再次站上全球榜单最高点。6月24日ISC 2026高性能计算大会公布最新IO500榜单中科曙光ParaStor F9000全闪存储系统包揽生产型全节点榜单和10节点榜单双榜第一也是首个达成此成就的中国厂商实现了历史性的零突破。成绩公布后中科曙光北京公司总裁助理、分布式存储产品部总经理石静用八个字概括了自己的感受“行稳致远、长期主义”。生产型榜单在真实业务中跑出来的成绩从评价标准来看IO500生产型榜单重点考察三个维度第一是长期稳定性系统在持续负载下是否保持性能不衰减第二是复杂混合负载能力能否同时处理大带宽顺序IO与高频小IO及元数据操作第三是规模扩展一致性在节点规模增加后性能是否仍然具备可预测性和可扩展性。生产型榜单最大的特殊性在于“真实”。首先是数据路径不能出现抖动否则会被复杂负载迅速放大。与很多可以专门为测试优化的环境不同IO500生产型榜单要求测试期间不能使集群中其他业务暂停。关键在于如何在不影响既有业务稳定性的前提下依然把存储性能有效释放出来并满足整体运行要求。比如在这套生产系统里本身就同时运行着多类应用。在此基础上叠加新测试或业务负载时所有业务都会集中对存储系统形成压力。这背后体现的是系统在性能调度与多业务均衡方面的设计能力。其次是多节点扩展后性能必须具备一致性而不是局部最优。此次10节点榜单与全节点榜单虽然采用相同测试用例但考察重点并不相同。前者注重扩展能力后者注重单点效率。“带宽能力和元数据访问能力对存储系统压力的实现方式不同如何用同一套存储架构应对不同类型的I/O压力也是挑战所在。”石静说道。最后是系统在高并发压力下必须保持长期稳定。IO500测试本身是一个持续时间较长的过程相比短时间的性能冲刺更关键的是在长周期运行中保持性能平稳同时支撑多种业务并发运行。从2U2N到PCle通道均衡设计关键技术的自主创新ParaStor F9000能够同时拿下两项榜单第一背后离不开硬件架构和软件层面的创新。硬件层面ParaStor F9000采用全NVMe闪存架构与市场上常见的2U24盘位全闪存储不同中科曙光设计了独特的“2U2N”双子星架构在2U空间内集成两个独立物理节点每个节点都拥有独立的CPU、内存、网卡和SSD。这种设计使数据路径实现简化NVMe介质与高速网卡均直接连接CPU中间不经过PCIe Switch转发最大程度减少性能损耗最大限度释放CPU的性能。中科曙光还对SSD和高速网络所占用的PCIe通道进行了均衡设计避免出现存储性能过剩而网络成为瓶颈或者网络能力富余而存储跟不上的情况实现存储介质性能与网络传输能力的同步释放。同时结合scaleFabric 400G高速网络实现兼顾高带宽和低时延需求。中科曙光高速网络互联产品部总工程师万伟表示首款全栈自研400G无损高速网络scaleFabric采用原生无损RDMA架构通过端到端零丢包保障低时延与高吞吐稳定性并完全兼容InfiniBand生态应用可无代码迁移。软件层面提供了精细化的QoS调度能力。针对不同业务场景例如10节点测试与全节点测试可以分别在文件系统、目录或计算节点维度设定带宽与IOPS的最低保障同时支持突发资源机制确保在高负载测试期间核心业务性能稳定同时避免对其他业务产生影响。ParaStor F9000在关键技术上实现了自主创新。中科曙光北京公司分布式存储总架构师袁清波介绍由于核心软硬件栈完全可控使得存储系统可以在协议栈、数据路径、调度机制等多个层面进行深度协同优化这也是ParaStor F9000能够在高负载场景下持续保持性能稳定的重要基础之一。面向AI时代的存储系统底座能力在AI体系中存储正在从传统数据仓库转变为“AI数据引擎”。其角色不再局限于数据存放而是延伸到数据流转调度、训练过程加速以及推理阶段支撑尤其是在KV Cache、向量数据库以及高频访问数据路径中存储已经深度参与计算过程。ParaStor F9000专为AI训练场景量身打造可提供从千卡到十万卡集群的整机柜交付方案支持千亿级参数大模型部署时间缩短1倍集群训练效率提升50%。据介绍ParaStor F9000首创AI存储三级协同方案实现“以存提算、以存代算、以存降本”。“以存提算”本质是通过存储侧的数据路径优化与智能编排把高频访问数据、训练关键数据尽可能前移到更高效的访问通道上让GPU不再等待数据而是持续获得稳定数据流从系统层面提升算力利用率。“以存代算”更多体现在对部分轻量数据处理与访问逻辑的下沉比如在存储侧完成KV Cache相关数据的组织优化、向量检索加速以及部分预处理操作把原本需要CPU参与的部分流程前移到数据层减少计算链路中的无效搬运和重复计算。“以存降本”则是通过数据分层与资源协同让不同访问频率的数据落在不同介质与路径上在保证性能的同时减少高成本资源占用实现整体系统的资源最优配置。自国家超算互联网核心节点启动建设以来ParaStor F9000 已投入实际生产环境目前该系统已在数万卡集群中稳定运行超过一年在大模型训练科学计算与数据分析等关键场景中提供支撑。可以说国产存储在真实AI基础设施体系中开始参与甚至在部分关键维度形成领先。并且这种领先是系统级能力、长期稳定性和规模化支撑能力的综合体现。