随着国家西部大开发政策的逐步深入,很多大中型数据中心落地高海拔地区。在此背景下,高海拔对数据中心,尤其是对数据中心电子设备的影响成为用户关注的重点。高海拔除了会对电子设备的散热、绝缘性能等方面造成影响之外,还会因为中子通量较大,造成电子设备故障,如比特翻转、宕机等情况的发生。
大气中的中子是初级宇宙射线与地球大气中的氧、氮等原子核发生核反应产生的,中子通量随着海拔高度的增长而呈现指数增长,大气中子特别是中高能中子的单粒子效应(SEE)已成为地面大型计算系统,如高性能计算机等可靠性不可忽视的威胁。
数据中心作为数据存储、处理及管理的重要基础设施,如因中子原因造成数据错误或丢失,则会造成不可计量的损失。为更好满足高海拔数据中心对于存储部件抵抗中子影响的基本要求,忆联特此联合国内知名实验室开展中子实验试验,以满足数据中心对SSD高可靠的需求。
1. 试验环境基本信息
本次试验配置如下:
1.1 服务器配置:
CPU:Intel 5218 *2
内存: 8*32G
网卡: 2*10GE+2*GE
1.2 试验SSD数量
本次试验产品主要为忆联自研的企业级UH8系产品,试验SSD数量共为12块。涵盖了UH810a、UH830a、UH811a、UH831a等企业级固态硬盘。
1.3 中子注量率
本次试验中子注量率为2.67*105n/( cm2·s)。
在国内地面条件下,阿里地区作为中子量最多的地区之一,中子注量率约为509n/ (cm2·h) (En≥1MeV) 。在不间断接受中子辐照的条件下,SSD在本次试验条件下接受到的累计中子注量远超国内地面可接收的最大累计中子注量(对比示例如图2)。
图2:累计中子注量对比图
2. 试验过程及结果
图3:试验环境整体示意图
图4:试验现场监测图
2.1 试验过程
所有盘片均在同一中子注量率下进行辐照,以中子辐照注量率达到试验要求为开始,以盘片功能失效为结束,通过自动化试验脚本记录运行时间;
5块SSD为一组,本次试验一共完成3组;
试验人员在监测室实时监测SSD运行状况,并进行统计。
2.2 试验结果
(1)部分单盘实测结果
图7:UH810a/UH830a单盘实测情况-2 图8:UH811a/UH831a单盘实测情况-2
(2) 详细运行时间统计
序号 |
SSD型号 |
运行时间/min |
平均运行时间/min |
总平均时间/min |
1 |
UH810a/UH830a |
28 |
6.5 |
11.7 |
2 |
10 |
|||
3 |
3 |
|||
4 |
2 |
|||
5 |
UH811a/ UH831a |
99 |
12.3 |
|
6 |
16 |
|||
7 |
14 |
|||
8 |
3 |
|||
9 |
5 |
|||
10 |
0 |
|||
11 |
4 |
|||
12 |
32 |
|||
注1:平均时间=有效SSD运行时间之和/有效试验盘片数(排除最高及最低运行时间) 注2:统计中的“运行时间”为在中子辐照下SSD可正常读写的持续时间。 |
从试验结果可知,UH8系产品在同一中子注量照射下,最低平均运行时间为6.5分钟,总平均运行时间为11.7分钟。
3. 试验数据分析
忆联SSD一般寿命为5年,以阿里地区中子注量率为基准的条件下,忆联SSD在5年内累计中子注量为2.23E+07 n/ cm2。在实验室条件下,忆联SSD为达到5年寿命,需在2.67*105 n/( cm2·s) 中子注量率下,运行时间达到83s。
在本次实验中,忆联UH8系SSD平均运行时间为11.7分钟,验证忆联UH8系SSD在较高的中子通量自然环境条件下,在5年寿命条件下可正常运行,具备抵抗一定中子辐照的高可靠性。
通过以上实测结果可以看到,忆联企业级UH8系SSD产品具备一定的中子抵抗能力,自带的ECC、RAID数据恢复、重读等功能,能够及时纠正中子带来的比特翻转等问题,保证在SSD使用寿命范围内可正常运行,为高海拔数据中心提供高可靠的SSD产品,助力西部地区建造更强、更安全的数据中心。