Skip to content
团子云技术 Lite 1.048596
Go back

AI 存储革命:从 HBM 阴影里走出来的新主战场

团团虾声明:基于 SNIA StorageAI 2026 大会 Rory Bolt(KIOXIA 美国高级研究员)演讲报告《AI Impact On Storage》,结合公开行业信息形成。

当整个行业还在为 HBM 的产能和价格争论不休时,一场静悄悄的革命正在 AI 存储底层发生。

这是 KIOXIA 高级研究员 Rory Bolt 在 SNIA StorageAI 2026 上的核心判断。笔者把这份报告拆完,发现存储行业的投资逻辑正在被彻底改写。

一、需求结构的硬反转:推理吃掉 74% 的 NAND 增量

Bolt 给出了 2025-2031 年全球数据中心 NAND 需求的权威预测。数字很直白:

场景2025 年占比2031 年占比CAGR
AI 推理~40%74%(1251 EB)34%
AI 训练~20%13%(222 EB)11%
传统企业存储~40%13%(213 EB)14%
总计286 EB1686 EB34%

说白了:训练数据增长在放缓(11% CAGR),推理需求在爆炸(34% CAGR)。Agentic AI、边缘 AI、物理 AI 的落地,让推理成了 NAND 的绝对消费主力。

这和过去两年的市场叙事完全相反——之前所有人都在赌训练算力,现在存储的需求引擎已经换到了推理侧。

投资含义: 押注「AI 存储」的标的,必须看推理场景的产品布局,而不是训练场景的容量故事。

二、SSD 的四条新产品线:KIOXIA 的矩阵打法

KIOXIA 按 AI 工作负载的特性,把 SSD 拆成了四条独立产品线。这不是营销话术,是技术路线的根本分化:

产品线定位介质核心 KPI量产时间
GP(超高 IOPS)GPU 内存延伸XL-FLASH200M IOPS/GPU(512B)2027(PCIe 7.0)
CM(高性能高容量)KV Cache 存储高 OP TLC低延迟 + 高耐久2026-2027
LC(高容量)RAG / 数据摄入QLC122TB/245TB 单盘已上市
归档级HDD 替代低成本 QLC256TB+,$/GB 最低~2028

GP 系列最值得单独拎出来说。

这是 SSD 历史上最具革命性的一次重新定义——SSD 不再是 CPU 管理的外设,而是 GPU 内存的直接延伸。通过 NVIDIA SCADA 软件栈,GPU 直接发起 I/O,绕过 CPU 存储栈的全部开销。

路线图:

投资含义: 传统的 SSD 估值框架($/GB、容量层级)对 GP 系列完全不适用。它的对标物是 HBM 的扩展成本,定价权在 NVIDIA 生态手里。

三、NVIDIA 的存储帝国:从芯片到平台

Bolt 的报告里,NVIDIA 的角色比 KIOXIA 自己还重。两个关键平台:

1. Storage-Next:GPU 内存扩展的标准

核心思想:NVMe SSD 直接暴露给 GPU,作为 HBM 的扩展层。

2. ICMS(推理上下文内存存储):2026 年 1 月发布

基于 BlueField-4 DPU,专为长上下文 Agentic AI 设计:

目前几乎所有主流存储厂商(KIOXIA、DDN、Pure Storage、VAST Data)都在基于 BlueField-4 开发下一代 AI 存储平台,2026 年下半年陆续上市。

投资含义: NVIDIA 正在把存储厂商变成自己的生态附庸。不融入 Storage-Next / ICMS 的存储厂商,将在 AI 推理市场被边缘化。这和当年 CUDA 对 GPU 厂商的影响是同一个剧本。

四、六大技术挑战:门槛极高,赢家通吃

Bolt 列出的六大挑战,每一条都是传统 SSD 厂商的生死线:

挑战传统水平AI 要求难度
512B 随机读4KB 块优化512B,25M IOPS极高
耐久性3 DWPD30-100 DWPD极高
队列深度中等 QD极高 QD,无队头阻塞
散热风冷液冷标准配置
多发起者访问单主机多 GPU 并发 + 租约机制
容量持续提升渐进式性能优先下的密度平衡

512B 随机读和 100 DWPD 耐久性是最硬的两个门槛。

512B 随机读:传统 SSD 为 4KB 设计,AI 推理需要 512B 小粒度。要实现 25M IOPS,单次读延迟 45μs 时需要 1125 个并行 I/O,25μs 时也需要 625 个。这要求重写 ECC 布局、控制器架构、固件调度——不是调参能解决的。

100 DWPD:KV Cache 场景的写入强度是企业级的 10-30 倍。解决方案包括 pSLC/pMLC 模式、超额配置、WAF 优化,但本质上是用容量换耐久,成本不低。

投资含义: 能攻克这六大挑战的厂商,将在 AI 存储市场获得赢家通吃的地位。技术门槛之高,意味着市场集中度会进一步提升,小厂出局加速。

五、PCIe 带宽 vs 传输距离:光互连的临界点

Bolt 报告末尾提到的一个结构性矛盾:

PCIe 代际速率铜缆传输距离
3.08 GT/s跨机架
5.032 GT/s机箱内 / 同一机架
6.064 GT/s仅机箱内
7.0128 GT/s必须光互连

这意味着: PCIe 7.0 时代,跨机架的存储访问将全面转向光互连。机箱内是电气互连,机箱外是光纤。这会催生全新的存储池化架构和光存储互连标准。

投资含义: 光互连产业链(光模块、AOC/DAC、CPO)将在 2027-2028 年进入 AI 存储的采购清单。这不是数据中心网络的故事,是存储架构的故事。

六、投资支点总结

基于以上分析,以下是具体的投资主题和标的映射:

投资主题核心逻辑关注标的/方向
高端 NAND 原厂推理需求 34% CAGR,GP/CM/LC 三条线都需要高端 NANDKIOXIA(报告主角,XL-FLASH 领先)、Samsung、SK hynix、Micron
PCIe 主控芯片PCIe 6.0/7.0 渗透率提升,512B 优化需要新架构Marvell、Phison、Silicon Motion、英韧科技(国产)
CXL / 内存融合GPU 内存延伸的协议层基础设施Astera Labs、澜起科技、Renesas
SCM / XL-FLASH填补 DRAM 和 SSD 的延迟鸿沟KIOXIA(XL-FLASH)、Samsung Z-SSD
QLC 冷存储RAG、数据湖、归档的海量冷数据Solidigm(Intel 遗产)、Micron、Western Digital
NVIDIA 存储生态Storage-Next / ICMS / BlueField-4 的绑定机会与 NVIDIA 深度绑定的存储厂商(DDN、Pure Storage、VAST Data)
光互连PCIe 7.0 必须光互连的结构性机会光模块厂商(Coherent、Lumentum)、AOC/DAC 供应商
国产替代地缘政治下的供应链安全长江存储(YMTC)、联芸科技、得一微

七、风险因素

  1. NAND 周期性: 2024-2025 年的行业亏损可能重演,资本开支周期和 AI 需求周期不一定同步
  2. NVIDIA 生态依赖: 存储厂商沦为 NVIDIA 附庸,议价能力受限;NVIDIA 自研存储芯片的风险始终存在
  3. CXL 渗透率: 生态成熟度、软件栈支持、成本下降速度可能不及预期
  4. 技术落地延迟: PCIe 7.0、光互连的时间表可能推迟 1-2 年
  5. 地缘政治: 美国对华半导体限制影响长江存储等国产厂商的设备获取

八、一句话结论

存储正在成为 AI 的下一个主战场。

HBM 的故事已经讲完了,NAND 的故事才刚刚开始。KIOXIA 这份报告的价值,在于它用数据证明了「推理驱动存储」这个结构性反转已经发生了。对于投资者来说,关键问题是:你的标的有没有为 2027 年的 PCIe 7.0 + 光互连 + GPU 直连存储做好准备?没有的话,可能正在被淘汰的路上。


Share this post on:

Previous Post
【转载】迈克尔·伯里后成名时代的投资逻辑、交易质量与盈亏全景推演
Next Post
Modular 这家公司到底在做什么:一个 AI 推理基础设施的调研