2026年01月19日/ 浏览 10
全网首发部署。
各位伙伴们大家好,Deepseek最近有多火相信大家都有目共睹,但是很多人并不知道的是它有一个革命的突破,就是不再局限于英伟达的显卡,而且可以全套支持国产算力。所以这次采用华为官方的A+K方案,即鲲鹏加升腾的组合来进行部署。
配置为华为Atlas800-3000服务器,满配4张升腾Atlas3001Duo推理卡,这里面每张推理卡是双核96的内存,4张更是达到了384G。有小伙伴问为什么?这个NPU的内存显示是80多,因为计算机是按照1K1024来换算的,所以显示上会比数值要略低一点。

首先测试了用单卡Atlas3001Duo来运行DeepseekR1的32B模型,先简单展示了一下这台服务器的各个硬件参数。这次只调用一张推理卡,也就是两颗核心来进行多轮问答测试。调动核心和部署的过程我会把视频发到P2,感兴趣的小伙伴可以跳转看一下。
这边我随便找了个问题来问Deepseek,可以看到后台两颗核心都跑了起来,这边稍微加速播放一下。再问个问题,可以看到单卡可以完美的跑起DeepeekR1的32B的模型。
还尝试了另一种高性价比的方案,用两张Atlas3001Duo推理卡来运行70b的模型,可以看到输出文本的精度和推理效果明显会提升不少。而且本纯血的国产方案无缝兼容现有集群,以预留API的形式可以快速接入开发部署。
如果视频点赞多、转发数量多,我也会再出一期视频来帮忙解答相关问题,比如部署的时候遇到的问题、对应的解决方法、尖叫性问题以及大模型之间的差距等等。欢迎大家来评论区讨论。
未来珑京科技还将持续关注开发更多的AI功能,继续为企业和个人用户提供更全面的智能化解决方案,我们也非常期待您的关注与支持。这次介绍就到这里结束。记得一键三连关注我们珑京科技,我们下次再见,拜拜!