010-88587556/9600/9800
动力信息化在保障数据中心动力安全中的重要作用

用户背景:某政府在2008年初完成一次改扩建工程,添置设备和占地面积均增加了50%以上,伴随而来的动力问题也开始逐步显现。起初,部分交换机、服务器出现了通讯端口烧毁现象,随后又发生个别网络设备和服务器电源烧毁的事故,而经多次更换未能根除问题,设备烧毁时有发生。多方工程师根据仅有的网管人员回忆,均难以确定故障原因,但可初步判定其间出现反复烧毁的设备绝非设备自身问题,而是外界供电系统异常所致。但由于缺少故障发生时刻的具体电网数据,而单纯依靠简单的仪表测量又不能在非故障时发现任何问题,因此该诟病继续困扰着机房管理人员。

2011年,我公司(傲视恒安科技)应机房集成建设公司邀请,参与对机房动力偶发性故障问题成因分析工作。同月,根据现场调研判定,此偶发性动力故障成因复杂,涉及故障点隐蔽,危害严重,遂决定安装我公司的动力大师ERM系统判断故障并持续保障机房动力供给。

在历时一周的施工准备后,厂家安装人员仅用36小时即完成了整个ERM监测系统的安装部署工作,其间断电施工时间仅为3.5小时(夜间非工作时段)。

在动力大师ERM系统上线工作后不到一周的时间,便捕捉到了最有可能造成前述故障的“罪魁祸首”——零地电压严重飘高和地线浪涌冲击。由于动力大师ERM系统能实现全天候24小时不间断测量和数据分析,并且能实现最高每秒2000次采样,因此该系统能严密的捕捉到任何异常的电网波动,哪怕问题的出现只有几个毫秒。而一般的动力监测采样低密度在0.5~5秒/次,无法精确定位故障源并准确分析故障成因,只有依赖动力大师ERM系统的高采样率、全点布控的检测设备,才能及时发现用电安全隐患并遇有排除。

经过工程师简单的操作,动力大师ERM系统给出引发电压波动的故障设备所在回路,管理人员顺利地找到了故障电源,该故障电源虽自身可正常工作,但它导致了零地半相连。原本从设计角度来说,理想中供电三相应力图平衡,零线电压可与地线持平,零线目排电流趋近于0,但该机房为什么会出现地线上的浪涌冲击呢,受此启发,复查地线接地情况,确实发现大楼公用地线与大地高阻,随即判定故障主要成因是机房接地不良,次要成因是部分用电设备电源故障,低阻连通零地。那么在分析烧毁的设备,全部为通讯相关设备,其原因在于通讯设备通常使用公共地作为参考GND并直接连接于电路板,具有的保护也无外乎一个瓷珠。因此当220V零线与通讯地线偶发性低阻连接,会使得通讯设备参考地电压突然升高。实际测量结果为偶发性零地电压20V以上。造成零线电压高的主要成因又是机房三相配平严重不良。综上各方面原因,由于故障形成的背景因素较多,错综复杂,故而通过一般的万用表测量难于准确及时发现故障点和分析故障成因,此类问题必须依靠诸如动力大师ERM系统等设备介入才可全面准确地将其分析透彻。

解决方案:更换故障电源设备或模块,地线增补大地接地点,调整三相平衡,并使用[动力监测系统]持续预警各种电网异常,及时遏制动力危害。

在随后的使用中,无论发生短路掉电,负载饱和,动力大师ERM系统都可以帮助管理人员通过简单操作分析故障成因,预警故障发生,即使调整供配电方案。该系统不但能为用户节省不必要的配件更换费用,更重要的是减少机房动力故障,提高机房设备Uptime比率,符合数据中心机房高可用性、高可靠性的追求目标