聚焦AI推理效能、推动存算协同发展 信通院举办“存力中国行”北京站活动

2026年01月19日/ 浏览 10

央广网北京11月5日消息(记者 万玉航)随着大模型落地实际业务的脚步日趋加快,Token调用量爆发式增长,推理成本持续攀升。业内观点认为,AI的发展标志着“Token经济”时代的到来,存储对大模型训练与推理效果至关重要。

如何解决算力基础设施面对的成本、效率、质量问题,促进AI推理高效发展?11月4日,由中国信息通信研究院组织召开的“存力中国行”北京站在信通院顺利举行。活动通过座谈会和实地调研的形式,深入探讨AI时代下先进存力对大模型发展的支撑作用。

座谈会上,中国信息通信研究院首席专家石友康指出,先进存力成为提升AI推理效能、控制成本的关键。当前,国家高度重视先进存力发展,在《算力基础设施高质量发展行动计划》等政策中明确提出“加速存力技术研发应用”、“持续提升存储产业能力”、“推动存算网协同发展”,为产业发展指明了方向。

信通院在政策研究、标准制定、测试服务等方面开展多项工作,并联合产业链企业成立“算力产业发展方阵先进存力AI推理工作组”。石友康在会上提出了三点建议:鼓励前沿存储技术研发创新,推动存算运深度融合,加强存算协同产业生态建设,呼吁业界同仁凝聚共识,共同推动我国存算协同发展。

中国移动云能力中心项目总师周宇认为,当前推理面临KVCache存储需求升级、多模态数据协同、存算协同带宽不足、负载潮汐性及成本控制等挑战。移动云针对性采用分层缓存调度、高速数据互联技术提升带宽、多模数据专属存储与标准化、架构池化重组等技术破局,通过高密全闪存储、数据缩减、自研SPU高密服务器提高了存储效能,降低了成本。“未来,移动云推动存储从被动存储转向智算协同,分阶段落地高密全闪存储、数据高速互联、存算一体等技术,长远构建池化多体存储体系。”周宇说。

华为数据存储产品线战略与业务发展部总裁王旭东指出,AI时代IT基础设施能力面临三大挑战:“管不好” 的数据、“喂不饱” 的算力、“降不下”的成本。具体来看,推理数据来源多样,难以形成高质量、可持续供应的数据集;存储系统的带宽和IOPS(每秒读写次数)不足,导致GPU等昂贵算力资源长时间空闲;传统存储架构难以兼顾高吞吐、低时延及异构数据融合的需求,造成业务发展瓶颈,阻碍AI应用落地。

他介绍,华为针对AI推理训练研发的UCM推理记忆数据管理技术,已在多个行业场景中落地,通过“集中高质数据、提速AI训练、优化推理效能”三个角度,打造AI推理加速解决方案。“在跨行业数据的采集标准和治理方面,华为已打造了高效的数据库,包括高性能可扩展的存储底座、全局文件系统和全栈解决方案的软件平台。”王旭东说。

北京硅基流动科技有限公司解决方案总监唐安波在会上围绕大模型推理“推不动、推得慢、推得贵”等问题展开分享,介绍了硅基流动构建的AI infra工具链,适配昇腾并优化DeepSeek模型,实现面向中小企业的性价比提升方案。

座谈会后,与会专家走进科大讯飞、华为北京研究所达芬奇展厅,实地调研存力技术的研发和应用进展,并针对促进“存算一体”、助力AI行业模型向中小微企业普惠、推动存储产业链生态协同发展等议题展开深度交流。

更多精彩资讯请在应用市场下载“央广网”客户端。欢迎提供新闻线索,24小时报料热线400-800-0088;消费者也可通过央广网“啄木鸟消费者投诉平台”线上投诉。版权声明:本文章版权归属央广网所有,未经授权不得转载。转载请联系:cnrbanquan@cnr.cn,不尊重原创的行为我们将追究责任。

picture loss