产品核心技术解决方案实测验证客户案例目标客户知识产权关于我们投资者关系新闻 联系 English

技术交流 PPT · 中科存储 vs NVIDIA

面向技术交流的 HTML 幻灯:存算分离全闪存储与 NVIDIA 推理新范式的客观对比,含 NVIDIA 官方技术描述与链接,可全屏演示、可导出 PDF。

这是一份什么样的材料?

这是中科存储面向技术交流的 HTML 幻灯(模仿 PPT),把中科存储的存算分离全闪存储技术栈,与 NVIDIA 的推理新范式(Dynamo 分离式服务、KVBM 分层 KV Cache 卸载、GPUDirect Storage、NIXL)逐项客观对比,并如实引用 NVIDIA 官方对这些相似技术的描述与链接

定位是公允、不贬损、可查证:中科存储数值取自单一数据源(含第三方实测 S38、项目方口径 S9),NVIDIA 描述均来自其官方公开文档。二者「同一范式、不同层次」,互补互通——存算分离全闪存储底座正是该范式所依赖的一环,中科存储面向国产算力底座(昇腾 / 国产 GPU)提供这一底座。

逐项对标 NVIDIA

存算分离 ↔ Dynamo、KV Cache 卸载 ↔ KVBM、GPU 直通 ↔ GPUDirect Storage、数据通路 ↔ NIXL。

可查证 · 不贬损

中科存储数值带 S9/S38 口径;NVIDIA 描述均附官方链接,以各方最新官方资料为准。

可演示 · 可导出 PDF

16:9 幻灯,方向键 / 点击翻页、按 O 总览;浏览器「打印 → 另存为 PDF」即得横向单页 PPT。

COMPARISON

中科存储 vs NVIDIA · 客观对比总表

以下为 PPT 中的对比总表(同源渲染,便于检索与引用);具体以各方最新官方信息为准。

维度中科存储 WS5000NVIDIA 对应能力(官方)
定位层次全闪存储一体机(硬件底座)推理编排 / IO 软件框架(Dynamo·NIXL·GDS)
存算分离硬件 EBOF + NVMe-oF/RoCEDynamo 分离式服务(prefill/decode 分离)
KV Cache 卸载KV-Cache 分层调度(显存↔全闪)KVBM 分层 G1→G4(GPU→CPU→SSD→远端)
GPU 直通路径GPUDirect 直通 + NVMe-oFGPUDirect Storage(GPU↔NVMe/NVMe-oF DMA)
主力算力适配国产 GPU / 昇腾 90%+(S9)以 NVIDIA GPU 生态为主
数据不出域 / 信创强(自主可控)视部署与合规评估
第三方实测有(北京信息科技大学·昇腾910B,S38)以官方 / 合作方资料为准
关系互补:可作该范式的国产存储底座开放接入第三方存储(WEKA / Dell 等)

口径说明

本表仅作客观维度对照,不构成对第三方的贬损。中科存储为全闪存储一体机(硬件底座),NVIDIA 为推理 / IO 软件框架,二者互补;中科存储数值标注项目方口径(S9)/ 第三方实测(S38)。

NVIDIA SOURCES

NVIDIA 官方对相似技术的描述与链接

以下描述均如实引自 NVIDIA 官方文档与开源仓库,可点击核验。

  • NVIDIA GPUDirect Storage(Magnum IO GDS)
    「GPUDirect Storage 在本地或远端存储(如 NVMe 或 NVMe over Fabrics)与 GPU 显存之间建立直达数据通路,绕过 CPU 内存中的中转缓冲(bounce buffer),由靠近网卡或存储的 DMA 引擎直接把数据搬入 / 搬出 GPU 显存。」
    NVIDIA Developer · GPUDirect · GPUDirect Storage Overview Guide
  • NVIDIA Dynamo · 分离式推理服务(Disaggregated Serving)
    「分离式服务把 prefill(预填充)与 decode(解码)放在不同设备上运行,使两者能各自独立扩展与并行;它需要三项能力:调度、用于 KV Cache 卸载与回载的内存管理,以及在节点间与内存层级间搬运 KV Cache 的低时延数据传输。」
    NVIDIA Dynamo · Introduction · ai-dynamo/dynamo (GitHub)
  • NVIDIA Dynamo KVBM · KV Cache 分层卸载
    「KV Block Manager(KVBM)提供一套统一内存 API,横跨 GPU 显存、锁页主机内存、远端 RDMA 可访问内存、本地 / 分布式 SSD,以及远端文件 / 对象 / 云存储;把 KV Cache 从 HBM 卸载到更廉价的存储层(G1 GPU → G2 CPU → G3 SSD → G4 远端),可加快 TTFT、降低 TCO 并支持更长上下文。」
    NVIDIA Dynamo · KVBM
  • NVIDIA NIXL · 推理数据传输库
    「NIXL(NVIDIA Inference Xfer Library)是一套低时延、与厂商无关的数据传输库,通过非阻塞 API 在 GPU 显存、CPU 内存与存储层(SSD / 远端)之间高吞吐搬运 KV Cache,服务于分离式 KV Cache 迁移、长上下文存储与模型权重传输等场景。」
    NVIDIA Technical Blog · NIXL · ai-dynamo/nixl (GitHub)
PREVIEW

在线预览

下方为内嵌 PPT,支持方向键 / 点击翻页;建议全屏查看,并可在 PPT 内点击「导出 PDF」。

在新窗口全屏打开 PPT(按 ⎙ 导出 PDF)

说明:本页 PPT 提供中英双语版本,随官网语言切换;所有数据可追溯、可复现。

用您自己的数据,跑出加载与吞吐对比

现有 2 套现货样机可即时送测。让数据说话,是最高效的验证方式。

最后更新: