你的位置:首页 > 新闻动态 > 公司新闻

华为UPS电源应急处理方案

2023/5/25 15:49:04      点击:

华为UPS电源应急处理方案

1.2 重大事故内容
UPS系统重大事故:主要包含UPS系统严重问题以及关键问题, 包括以下方面
1.导致了紧急故障;
2.可能对安全产生了影响;
3.影响到后级设备的正常工作;
4.故障如果不能短时间排除,会导致后级设备的供电风险;
在出现重大事故后,必须进行业务恢复,并尽量缩短业务恢复处理时长。
1.3 应急处理的内容
UPS系统重大事故应急处理包含以下故障的处理,本故障已经或将导致极大的供电风险,从而导致或将导致重大事故:
1.安全事故的处理
2.故障信息获取及判定
3.外部故障处理流程
4.内部故障处理流程
1.4 重大事故处理说明
1.事故处理人员必须具备相应的电气或电池维护的资质,在维护过程中,遵照当地的电气安全法律法规,进行自身安全防护,切实保障个人的人身安全。
2.紧急处理的过程操作,应当用标识牌进行标识。临时性的措施要放置提示或警示标识,将记录在紧急维护卡中。
3.在紧急处理过程中,会采用一些非规范非可靠的临时措施,在问题可以根除后,解决所有的临时措施,使整个UPS系统符合规范。
4.一般情况下,即使是发生严重告警,UPS系统仍可能供电。
5.在遇到故障时,一定要冷静处理,对故障范围进行模块式的定位,并评估其它的功能模块是否可以不受影响,从而避免处理扩大化。
6.在进行事故处理时,要与UPS维护策略相对应,如果有些小机维护策略为直接更换主机,则在判断事故由机器内部故障导致后,不需要进处理,直接更换UPS。
1.5 事故处理工具与防护
1.必须熟悉机房的设施,包括灭火装置、逃生路径、手电、身体防护装置等。
2.配备必要的工具包,包括,万用表、钳流表、螺丝刀、剪钳、绝缘手套、防静电手套等。
2 重大事故的应急处理
2.1 安全事故的处理
在重大事故处理时,人员安全是第一位的,在保证人员安全的前提下,再保障设备与机房的安全,清除事故或防止事故扩大。
1.在涉及或冒烟起火的场景,应准备好适用于电气火灾的灭火器。
2.冷静处理,防止事故扩大,但处理过程中,一定要基于模块化的结构,分块处理故障,防止不受影响的模块或区域受到不应有的波及或牵连,防止事故处理范围扩大化。
3.如果由于公共电网事故,如电网高压,电网供电错误,所导致的UPS系统供电故障,应当在保障安全的情况下,先对上级供电进行隔离,才能进行下级电源系统的处理。
4.在遇到高压电网故障、雷击故障时,应当评估人员安全,禁止在高压电网故障或仍有雷击风险时,派人进机房。在遇到不可抗拒力如山洪、地震导致的UPS系统供电故障时,应先保障维护人员的安全,方可进行应急处理。
5.在处理电池故障时,应当做好排氢,防酸雾的准备工作(如对机房进行通风对流处理,做好个人防护等)。
6.在不涉及人身安全的情况下,应尽量确保用户机房负载安全,在做单机维护时可使UPS切换到维修旁路,并机或双母线系统的维修应参照相关手册确保负载不断电。
2.2 故障信息获取
发生故障的第一现场资料非常重要,根据这些资料可以大概判断故障点和故障原因,可以制定出正确的解决方案。因此工程师到达现场首要的事情是记录有关UPS的所有状况,主要记录以下内容:
1)UPS状态(面板信息):发生故障时,UPS处于哪种状态,逆变、旁路、无输出或者控制面板无显示;
2)UPS实际输入、输出、电池参数:发生故障时面板显示参数不一定代表UPS的真实参数,可用万用表测量UPS端子上实际参数,并作记录,包括:输入电压,输出电压,电池电压;
3)UPS告警信息记录,如果有条件,请下载告警记录以用于分析故障。
4)UPS各个开关的位置;
5)UPS环境记录:UPS周围环境对UPS工作同样非常重要,做完上述记录后,应对UPS周围工作环境做记录:
a)UPS通风如何
b)UPS环境温度
c)UPS周围安装距离是否符合要求
d)UPS周围是否环境不良(如粉尘或潮湿)
e)UPS输入输出电池配线如何?线径是否满足要求?电力绝缘皮是否有损坏?UPS接线端子是否有松动现象?
f)UPS所带负载名称、类型、额定功率等情况(可向客户咨询)
2.3 外部故障处理
故障类型识别:记录完故障信息以后,参看各UPS的故障信息说明表,大多数情况,故障是由于UPS外部原因引起的,先依据故障信息表定位并排除外部故障。
外部故障处理,应按以下原则进行:
1)UPS因外部故障导致的报警,UPS输出可能没有中断,首先要根据报警信息判断是否对输出有影响,如果有影响,请先考虑将UPS切换到旁路或者维修旁路。
2)根据报警信息,参考UPS用户手册中故障处理章节内容,对故障进行定位。有些报警外部故障或内部故障都有可能导致,应先排除外部故障。
3)在对外部故障进行定位时,应先了解整体UPS系统,以免盲目动手造成误操作。
4)处理外部故障,需用万用表,电流钳等工具,按照告警信息定位,从源头一步步进行确认,直至发现故障点。
5)发现故障点,需要对UPS系统进行操作时,要先考虑该操作对UPS造成的影响,确认清楚以后再动手操作。
常见外部故障原因:
1)负载过重
2)输入、输出过、欠压
3)市电空开断开或市电异常
4)输出短路
5)电池低于低限
2.4 内部故障处理
若可能由UPS内部原因导致报故障,在操作前应做好如下判定。
1)若用户负载可中断。请先关闭用户负载,再参考用户手册关闭UPS,断开所有输入输出开关,等待至少5分钟,用万用表确认UPS母线上没有危险电压后再进行UPS内部的维修操作。
2)若用户负载不能中断,请先根据机器类型判断哪些是可热插拔部件。如果故障定位在可热插拔部件上,判定热插拔操作不会对负载产生影响后,再进行更换。
3)如果故障模块不支持热插拔操作,需要转维修旁路,请按用户手册步骤将UPS切换到维修旁路,等待至少5分钟,用万用表确认UPS母线上没有危险电压后再进行UPS内部的维修操作。
4)如果是并机或双母线等冗余系统,支持单台UPS的热退出,综合考虑负载等各方面因素,确认故障机器可热退出后,按用户手册步骤将故障UPS退出UPS系统。故障排除后再按用后手册定义步骤将恢复后的UPS热加入到整个系统。
若需要更换模块或单板才能排除故障,请注意以下操作。
1)对UPS内部故障进行处理时,应按照手册中故障信息表进行判定,逐一进行排查。
2)单板和模块的更换必须由经过培训的专业人士才能进行操作。非专业人士请勿擅自操作。
3)更换模块或单板时,应根据工程师手册相关指导进行。
4)拆除模块或单板时,如果拆除的连接线较多,应该做好标示,以便在更换时不发生接线错误。
如果通过以上手段仍不能排除故障或一线人员没有能力进行内部故障处理,请将告警相关信息及时反馈给总部研发人员获取技术支持。
3 疏理与清理
1.由于应急处理时,很多措施是临时措施,必须在确保问题解决封闭后,及时清理各种临时的措施的标识,临时操作状态。
2.临时的应急措施如果不能最终解决问题,只是为最终的解决方案创造时间缓冲,则在最终解决方案实施后,根据应急措施采取过的措施进行恢复,防止临时的不规范的措施遗留在最终方案中。
3.重大事故处理,经验很重要,同时经验的积累也很重要,在完成事故处理后,应当进行详细地案例总结。

华为ups电源经成为数据中心电池电源的强力竞争者,因为华为ups电源与金武士先进的UPS系统能顺利集成。此外,华为ups电源提供更多能量和功率密度,可以让更小的UPS系统更灵活地放置在数据中心中,且比铅酸电池更适应较高的温度。当选择华为ups电源时,请记得他们不是热插拔的,且他们并非直接替代铅酸电池。华为ups电源会比传统电池要贵一些,同时其较复杂的电池管理系统也会增加成本。  

  在2017年,你可能会看到金武士蓄电池技术在可用性方面取得进步。当前,有一些UPS厂商为其UPS产品提供华为ups电源选择。  

  当UPS电源功率密度的增加可以提高效率并合乎预算,但也会带来可能导致灾难性服务器崩溃的冷却故障的风险。如果你在移动或添加设备的时候没有考虑到数据中心的冷却能力,那么热点就会发生,并且不容易被识别出,直到损害浮出水面。  

  为了以较为合适的成本更方便的找到数据中心热点,可在每个机架的顶部、中部和底部安装温度指示消隐板(指示入口空气温度的彩色热敏条),如果预算紧张那么就在重点硬件上安装就可以了。 

  华为ups电源温度和湿度探头是另一种选择,华为ups电源作为智能机架配电单元的附件、设备或数据中心基础设施管理(DCIM)工具的一部分,可以提供数据中心温度的实时图像显示。为了模拟安装和测试冷却功能,它将计算流体动力学(CFD)气流建模和探头读数结合起来。事实上,防止冷却故障最好的办法就是使用CFD,创建数据中心的3D模型。