摘要:今天主要介绍一下有关数据中心运维管理的经验。
1、空调与机房错层设计,可以有效防止漏水。
2、机房蓄电池的使用环境温度非常重要,25度是最佳值。
3、要注意电池的生产批次,讲究其一致性,不同批次的产品性能会有略微差异。所以在采购蓄电池时,可以每组同批次的多买2节电池,放入系统中作为电池组的热备份,当今后某节电池出现问题时,可以及时顶上。
4、要建CMDB,如果没有建立CMDB库,那么一定要建立一本简单的台帐,EXECL表就可以。
5、数据中心没有突发事件,所有事件的发生都应做到预案化。所以要不断的去完善应急预案,要通过头脑风暴去设计不同的应急场景。应急管理工作永远都是在不停的丰富和优化。
6、强调日常工作中预案管理的重要性。
7、应急演练不要总安排在工作日白天,因为白天往往是人力资源最完整的时候,我们演练的一个重要目的是要提高基础值班人员的响应速度和处理能力,这个初始速度非常重要,很多灾难如果响应及时,处理得当,完全可以减轻损失。
8、设备采购谈判时一定要谈好今后的维保,至少3年。
9、空调系统如果采用全水冷的方式,那么一定要考虑水压问题,也一定要确保所在区域不会计划性停水。
10、为保证供水压力,可以考虑单独铺设水管。
11、ATS要放在母联的下面……
12、PS并机, 4台并机比较可靠,超过4台可靠性就会下降。
13、UPS放电时间要有控制,建议不要超过其剩余容量的30%。
14、UPS间要放备用工具箱,发电机间要有应急照明,主要设备旁要张贴应急处理手册和故障恢复流程。
15、 UPS中的逆变与旁路要求同步,同步频率范围要依据负载来定,要以最小范围来调。
16、 UPS调试时,旁路与逆变的转换要多转几次。
17、 隔离变压器的作用之一可以使0地电压降低,对设备提供保护。
18、UPS输出切换到旁路的时候,要注意同步灯有没有亮,同步灯亮就不能强行切换,否则会造成输出断电。
19、3相不平衡会导致0地电压变大,所以基础设施管理人员一定要严格把握,不能随便乱加负载。(三相不平衡会导致中线电流变大,当大于相线电流时,就会加大零地电压)
20、先算出电流再选择线缆。
21、 电池放电到欠压告警,可以估算出电池的实际可支撑时间。
22、 电池接线,要注意铜和铅不要直接接确,不然会互相腐蚀,增加电阻,影响电池的放电电压。
23、UPS至少每半年要检修一次,要关注UPS风扇,电离和电容都要重点关注。
24、STS要求2路供电的相位和频率范围一致,如果来自不同的变电站,可能存在相位、频率不一致的情况,极端情况下,会造成未端STS无法自动切换。
25、 空调外机要做好标识,尤其是风冷外机,要与内机一一对应,以提高故障判断和处理的效率。
26、要重视监控数据的分析,风机、压缩机的运行电流数据可以预判设备的健康情况。
27、机房内的温度检测可以同时放在冷通道和热通道,但监控应以回风温度为准,所以温度探测仪要放在回风通道的上方。
28、 空调的加热装置不能随意关闭,系统的自带功能不要人为随意干预。
29、 空调选型时,要选同尺寸内功率最大的。
30、 空调外机清洗要注意安全使用高压水枪,不能从侧面冲洗。
31、制冷剂、机油不同品牌不能混用,否则易造成压缩机故障。
32、每台空调内机的支路一定要装阀门,利于检修,给水的阀门一定要做好标识。
33、 制冷剂发生泄漏,不要第一时间去抢修,要让其散发完整,以减少对人体的损害。
34、冷池的顶板起落最好要带有阻泥,防止突然降落对人身造成伤害。
35、 发电机启动时要注意空调的瞬时启动电流,其会导致发电机启动失败,最好设置延时,软启动。
36、UPS、消防要做到只监不控,否则风险太大。
37、以后可以考虑引入智能列头柜。
38、储能、储油类系统(如电池、柴油发电机)要当心其二次、三次灾害,七氟丙烷是一次性灭火,而不是持续性灭火,遇上电池火灾,效果不一定很好。
39、柴油发电机灭火,可以考虑高压油雾灭火系统。
排风、通风或抽风系统的用电不要接入机房内的配电系统,要独立,防止机房起火停电后,因排烟、抽风不能用而延缓系统修复速度。
暂无评论内容