计算机行业人工智能存储:AI拉动需求增长,存储大周期方兴未艾

2026年01月23日/ 浏览 8

(报告出品方/作者:国信证券,熊莉、艾宪)

存储系统:系统构成与分类

存储系统:AI工作负载在不同阶段需要不同存力支撑

源数据(网络SSD和HDD):硬盘(HDD)能够长期保存原始数据并提供数据保护;固态盘(SSD)作为即时访问的数据层; 训练模型(HBM、DRAM、本地SSD、网络SSD和HDD) :数据快速从存储加载到HBM、DRAM以及本地固态盘,供后续计算密集型操作使用;其中,网络HDD和SSD存储检查点(CheckPoint),以保护和优化模型训练; 创建内容(HBM、DRAM、本地SSD):推理过程中的内容创建主要依靠HBM、DRAM和本地SSD或HDD完成; 存储内容(网络SSD和HDD) :存储内容以便后续优化,硬盘用于存储并保护内容的副本; 保留数据(网络SSD和HDD) :复制的数据集跨区域和环境进行保留; 重用数据(网络SSD和HDD) :元数据、模型数据以及推理数据推动了下一步工作。

存储系统:英伟达H100存储系统拆解

HBM:以英伟达H100为例,单颗H100配置了6颗HBM3堆栈(单堆栈为8个堆叠,单一堆叠为2GB,总共96GB); DRAM:以英特尔Sapphire Rapids为例,单颗CPU支持8个内存通道,每通道支持2个DIMM;英伟达H100单台服务器配置两颗CPU,共计32个DIMM插槽,配置32个64GB DRAM(共计2TB)作为系统内存;本地SSD:英伟达H100服务器配置8个3.84TB的SSD(使用NVMe协议)。

存储系统:英伟达存储系统比例关系

英伟达DGX B200(8卡服务器)为例:根据英伟达披露数据,单颗B200配置HBM3E(180GB/s),则单台服务器(8颗B200)合计1.4TB/s;主板DRAM为2TB(可拓展至4TB,即System Memory),服务器本地SSD为8个3.84TB(合计30.72TB);根据IBM披露数据,如果英伟达DGXB200服务器搭配IBM存储系统,4U(约127个计算节点)需要配置一个IBM Storage Scale 6000存储系统(加装9个硬盘HDD,对应3.4PB存储),则单台服务器对应27.4TB HDD,随着多模态模型的发展,以及逐步从训练侧转向推理侧,大量生成的图片、视频数据需要存储,网络存储需求有望持续提升。

存储分类:经典的存储金字塔层级

存储金字塔:存储主要可以分为“易失性”的内存(Memory)和“非易失性”的存储(Storage),存储金字塔自上而下,性能逐级下降、容量逐级递减、成本逐级递减。 内存(Memory):主要包括DRAM和HBM,属于“易失性”介质,断电后就会丢失信息,优势为速度快,劣势为成本高、容量有限,通常访问频繁或者随时变更的数据会保留在较高的存储层; 存储(Storage):主要包括SSD和HDD,属于“非易失性”介质,优势为容量大、成本低,劣势为性能较弱,通常访问较不频繁或需要长期保存的数据将移动到较低的存储层。

市场与技术趋势:HDD、SSD、NAND、DRAM、HBM

硬盘驱动器(HDD):面密度提升是容量提升的核心

HDD架构:通常包括机械部分和电子部分。 机械部分:主要包括底座、主轴电机、盘片、音圈电机、磁头组、顶盖等部分,所有盘片平行地安装在同一个转轴上,盘片的两面分别对应一个磁头,所有磁头关联在同一个磁头组上,磁头组尾部有一个音圈电机,驱动整个磁头组围绕同一个轴承旋转摆动; 电子部分:主要包括主控SOC、电机驱动芯片、RV传感器、Shock传感器、DRAM、Flash ROM等器件; 面密度提升是HDD容量提升的核心:面密度可以分解为两个相互垂直的分量,圆周方向的记录密度(Linear Density,沿着单个磁道上单位长度可以存储的数据位数)和磁道密度(Track Density,每英寸磁盘表面可以容纳的磁道数量。传统磁记录技术(CMR),磁道间是独立、有间隙的,没有依赖关系;叠瓦式磁记录(SMR)允许相邻磁道部分重叠,提高了磁道密度,能存储更多的数据。

硬盘驱动器(HDD)技术趋势:HAMR提升单碟容量

HAMR(Heat-Assisted Magnetic Recording,热辅助磁记录)技术发展:希捷在HAMR技术具备领先优势,通过HAMR技术,目前量产产品达到单碟3TB、全盘30TB,此外单碟4TB、5TB已经在路线图中。25年1月希捷宣布,基于HAMR技术的魔彩盒3+平台加持下,可在十碟片中提供36TB的容量点,未来有望实现单碟容量10TB。

HAMR提升单碟容量:随着时间的发展,HDD的盘片数量和盘片面积已经相对固定,提升磁盘的面密度成为主要的技术路径。面密度的提升会导致放置单位比特信息所占用的磁性颗粒面积变小,因为导致颗粒间相互磁影响越来越大,为保持信息稳定,需要使用高矫顽力颗粒,因而需要磁头施加刚强大的磁场变化,进而导致更长的操作时间和更多的干扰。HAMR技术通过等离子写入器精准地加热目标区域的超晶格铂合金介质,瞬间升温400℃以上,临时降低矫顽力以辅助写入,且在不到2ns的时间内迅速冷却。

固态硬盘(SSD):以NAND Flash为介质的存储设备

固态硬盘(SSD)结构:SSD是一种以NAND Flash为介质的存储设备,其与HDD不同,SSD以半导体存储数据,用纯电子电路实现,其主要包括主控(Controller Chip)、闪存(NAND)、缓存芯片(Cache Chip,部分SSD只配置SRAM,未配置DRAM)、PCB(电源芯片、电阻、电容等)、接口(SATA、SAS、PCIe等)。

固态硬盘(SSD)工作原理:从主机开始,用户从操作系统应用层面对SSD发出请求,文件系统将读写请求经驱动转化为相应的符合协议的读写和其他命令,SSD收到命令后执行相应操作,然后输出结果。SSD的输入是命令(Command),输出的是数据(Data)和命令状态(Command Status)。

前端通信和相关协议模块:接受主机发来的命令和数据,命令经SSD处理后,交由前端将命令状态或数据返回主机,SSD通过SATA、SAS和PCIe等接口与主机相连;

中间的FTL(Flash Translation Layer)模块:SSD收到命令后执行命令,并接收主机要写入的数据,数据一般会先缓存在SSD内部的RAM中,FTL会为每个逻辑数据块分配一个闪存地址,当数据到达一定量后,FTL便会给后端发送写闪存情况;

后端和闪存通信模块:接受FTL写闪存请求后,会将缓存中的数据写到对应的闪存空间,由于闪存不能覆盖写,所以闪存块需要擦除才能写入,主机发来的某个数据块不是写在闪存固定位置,SSD可以为其分配任何可能的闪存空间供其写入,所以需要FTL完成逻辑数据块到闪存物理空间的转换或映射。

DRAM下游需求:手机、PC、服务器合计占比为75.2%

DRAM下游需求情况:根据IDC披露数据,2024年DRAM下游需求领域主要包括手机、PC、服务器、图像、工业主板、数字电视、模块升级、平板电脑、游戏、其他等,其中,手机、PC、服务器占比分别为33.7%、25.2%、16.3%,合计为75.2%,为DRAM主要需求领域;

DRAM下游需求变动情况:手机、PC行业销量增速放缓,预计占比持续下滑,根据IDC披露数据,预计2029年占比分别为24.2%、20.0%,相较于2024年分别-9.4、-5.2个pct;此外,随着AI服务器快速放量,大模型需要高容量的DRAM作为主存储器,服务器用DRAM、图像用DRAM(包括HBM和游戏主机GDDR)占比有望持续增长,预计2029年占比将分别提升至28.7%、12.4%。

HBM:更高的显存位宽和带宽

HBM(High-Bandwidth Memory,高带宽内存):多层DRAM芯片堆叠,通过TSV实现垂直方向的互联,即HBM通过TSV(硅通孔,在数个DRAM芯片搭配数千个细微孔并通过垂直贯通的电极连接上下芯片的技术,通过贯通所有芯片层的柱状通道传输信号、指令、电流)及微凸点将4层DRAM芯片层与1层基本逻辑控制芯片实现三维堆叠,进而具有更高的存储密度和更大的带宽,以及更大规模的I/O端口;其核心价值在于提供了更多的I/O数量,通过增加位宽的方式尽可能降低了GPU访问DRAM的延迟。此外,GPU和DRAM先通过Bump(微凸点)和Interposer(互联功能硅片)连通,Interposer通过Bump和Substrate(封装基板)连通到BALL,最后由BGA BALL连接到PCB。

HBM具备更高的显存位宽和带宽:根据SemiAnalysis披露数据,同DDR5、LPDDR5、GDDR6X相比,HBM3在显存位宽(Bus Width)大幅提升(通过TSV技术),进而带宽(Bandwidth,传输速率*位宽)大幅提升。

需求测算:AI训练、推理拉动存储需求增长

大模型对存储的需求:训练&推理

大模型训练:原始模型参数权重、训练数据等存储在网络存储(HDD/SSD),然后传输到本地SSD,进而读取到CPU内存(DRAM),然后加载到GPU显存(HBM)进行计算。

大模型推理:通常从本地SSD读取模型权重文件到HBM/DRAM中,并处理输入Token在HBM/DRAM中生成初始的KV Cache(若启用了检索增强功能,通常向量数据库存储在NVMe SSD中),之后大模型开始逐token生成输出序列(每生成一个新的token,KV Cache随之增长,如果超过HBM/DRAM可用容量,则会offload到NVMe SSD中,便于后续推理再读回),最终模型响应和交互元数据会写入永久性存储,亦放入NVMe SSD中。

大模型对存储的需求:训练侧-对HBM的需求测算

大模型训练对HBM需求:大模型训练主要包括前向传播、反向传播和参数更新三个阶段;1)前向传播:训练数据依次通过模型的各层进行计算,并产生激活量(不仅作为下一层的输入,还会被保存以供反向传播使用);2)反向传播:前向传播结束后,计算结果与训练数据的标签比对,生成Loss(误差),Loss与各层参数以及保存在该层的激活量进行计算,进而产生每一层参数对应的梯度;(此处,每一层梯度计算完后,其激活量可以释放掉,而梯度数据需要被保留用于参数更新);3)参数更新:优化器根据保存的梯度以及其自身的参数(如动量等)更新模型参数,参数更新完成后,上一版本的模型参数、梯度数据以及优化器参数被释放。

公司梳理:全球存储公司业务重心

全球存储公司梳理:三星电子

从收入结构来看:根据公司财报披露数据,3QFY2025公司DX部门(TV、手机、空调等)、DS部门(DRAM、NAND、移动Aps等)、SDC(OLED手机面板)、Harman(智能座舱、汽车音响等)收入占比分别为55%、33%、8%、4%,存储业务为公司第二大业务,仅次于消费电子业务。

从竞争格局来看:根据IDC披露数据,25Q2全球DRAM市场,三星电子市占率为33.2%,全球第二;25Q2全球NAND市场,海力士市占率34.0%,全球第一;25Q2全球HBM市场,三星电子市占率17.0%,全球第二;25Q2全球SSD市场三星电子市占率为32.0%,全球第一,在消费级、企业级SSD均具备竞争优势。

从发展历史来看:1)公司发展历史:公司1969年成立,最初主要生产电子电器类产品,1874年通过收购韩国半导体进军半导体业务;1983年开始发力DRAM领域,1984年研发成功64kDRAM;1988年公司在韩国推出第一部手机;1998年开发出第一款128MB Flash闪存,2004年公司研发出全球首款8GB NAND闪存,2005年开始进入晶圆代工行业,2011年出售HDD业务,专注发展存储芯片,2016年收购Harman,强化自身在汽车芯片、车载娱乐领域优势。2)从DRAM产品发展历史来看:1984年研发成功64k DRAM,1996年首次提出DDR概念,1998年发布全球第一个商用DDR芯片,2003年量产DDR2,2008年开始DDR3,2013年量产DDR4,2021年量产DDR5。3)从HBM产品发展历史来看:2016年量产HBM2,2020年量产HBM2E,2023年量产HBM3,2024年量产HBM3E。3)从NAND产品发展历史来看:1998年开发出第一款128NM Flash闪存,2013年开始进入3D V-NAND阶段(24层),后堆叠层数持续增长,2024年第九代VNAND(300+层)量产。

全球存储公司梳理:海力士

从收入结构来看:根据公司财报披露数据,3QFY2025公司DRAM(包括HBM)、NAND(包括SSD)、其他业务收入占比分别为78%、20%、2%,DRAM、NAND业务为公司主营业务。

从竞争格局来看:根据IDC披露数据,25Q2全球DRAM市场,海力士市占率为39.1%,全球第一;25Q2全球NAND市场,海力士市占率22.0%,全球第二;25Q2全球HBM市场,海力士市占率67.0%,全球第一;25Q2全球SSD市场海力士市占率为19.6%(包括Solidigm,收购的英特尔的NAND业务),其中海力士优势在消费级SSD领域,市占率为9.15%,全球第四,Solidigm优势在企业级SSD领域,市占率23.18%,全球第二。

从发展历史来看:1)公司发展历史:公司1983年成立,最初名为现代电子,以DRAM的生产制造为主;1998年收购LG半导体,2001年改名为海力士,2003年从现代集团完成剥离,2004年出售非存储业务,将重心转向半导体存储;公司于2012年并入SK集团,改名为SK海力士;2021年SK海力士收购英特尔的NAND业务,成立了Solidigm;2023年开发并大规模生产全球最高规格的HBM3E。2)从DRAM产品发展历史来看:1985年,公司256kb DRAM量产,整合LG半导体后于2001年推出128MB DDR SDRAM;2003年底512MB DDR2通过英特尔认证,2004年开始量产;2007年开发出业内首款DDR3并获得英特尔认证;2011年成功研发2GB DDR4;2018年完成DDR5研发,2020年正式量产;2013年与AMD联合开发全球首款HBM1,2017年发布HBM2,2019年发布HBM2E,2021年发布HBM3,2023年量产HBM3E。3)从NAND产品发展历史来看:2004年开始进军闪存领域,开发了512MB NAND闪存,2014年正式进军3D NAND领域,推出24层3D NAND芯片,2018年业内率先实现4D NAND商业化突破,发布96层4D NAND闪存,2024年开始量产全球首款321层4D NAND闪存。

报告节选:

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

精选报告来源:【未来智库】。未来智库 - 官方网站

picture loss