AI计算机作为军用端侧设备,集成算力最高可达3840TOPS@INT8,可完整本地部署671B/千亿参数DeepSeek模型。设备实现了100%国产化自主可控,实现AI大模型从实验室到工程化的跨越。
软件生态:
AI计算机具有应用覆盖广、开发易迁移的特点。支持常用的深度学习框架,代码无需重新开发,支持CUDA编程,兼容各种软硬件生态。
在应用功能方面支持500+人工智能模型、通用及高性能计算应用。支持超过50+频谱专用算法,可进行电磁领域信号的智能处理,支持振动异常检测、惯导姿态估计等感值模型。特别地,AI计算机支持671B的Deepseek-R1模型完整本地部署。
DeepSeek模型部署:
AI计算机基于多卡国产GPU硬件拓扑,采用流水线并行(Pipeline Parallelism)、专家并行(Expert Parallelism)和数据并行(Data Parallelism)相结合的模型部署方式,支持Deepseek-R1 671B模型完整本地部署,对模型采用4 bit 量化,并采用llama.cpp、vLLM大模型推理框架进行推理优化。
模型库:
支持500+人工智能模型、通用及高性能计算应用:支持AlexNet(卷积神经网络)、BERT(自然语言处理)、Inception_V3(神经网络)、ResNet50 t(卷积神经网络)、VGG16(卷积神经网络)、YOLOv5(目标检测)、RF-LeNet(指纹识别)、Signet(通信模式识别)、Spectrum-volox(混合信号分离)、FreqTimeNetV2(智能信号估计)等多种AI模型。
支持超过80+感知专用AI算法,包括振动异常检测、惯导姿态估计、电磁频谱通信指纹识别、通信信号调制识别、电磁频谱信号检测、智能通信信道估计等在无人车、电磁通信信号等感知信号领域内,提供在特定领域内AI算法开发部署demo。
系统架构:
AI计算机基于军用VPX高速总线设计,以S5000C CPU板为管理核心,搭配6U VPX通用GPU计算板、高速交换板,使用PCIe4.0实现高速数据流通信,使用千兆以太网实现控制流,搭建了一个松耦合星型关系拓扑架构。在有限空间内集成了大量GPU算力。
CPU板卡参数:
国产CPU处理器:飞腾S5000C处理器,32核,主频2.3GHz
芯片组:飞腾X100芯片组
显示:2路VGA、1 路 DVI接口
内存:板载4通道DDR464GB DDR4内存,支持 ECC
板载存储接口:M.2连接器接口
支持2路SRIO接口、40G 以太网传输接口、千兆网络接口
PCIE接口:2路×16 PCIe4.0/5.0接口
支持银河麒麟桌面版操作系统
GPU板卡参数:
支持ARM架构CPU,支持麒麟操作系统
算力:384TOPS@INT8、192TFLOPS@FP16、48TFLOPS@FP32
内存:64GB
接口:PCIe Gen4.0 ×16
功耗:300W
工具链集成多种主流深度学习编程框架,并且提供基于C/C++的编程接口和高性能函数库
深度学习,支持主流DL开发框架TensorFlow、Pytorch
支持 500+个AI模型
开发易迁移,几乎无OP适配
视频解码:最大支持128路并发(1080@30fps),支持HEVC/AVC/VP9/AVS2
图像编码:2000/500fps(JPEG)
支持 ECC,支持虚拟化
板卡实物图:
CPU板实物
GPU板实物