华为告警处理手册1.0.doc
《华为告警处理手册1.0.doc》由会员分享,可在线阅读,更多相关《华为告警处理手册1.0.doc(80页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流华为告警处理手册1.0.精品文档. 目 录1. MSC SERVER处理分册31.1 告警箱处于离线状态31.2、FE端口故障31.3、WCKI时钟参考源丢失41.4、控制框与业务框通信失败51.5、BAM到主机通讯失败71.6、BAM到主机连接中断81.7、与NTP服务器断连91.8、Q922链路故障101.9、TCP链路故障111.10、CPU过载121.11、单板网口协商失败141.13、许可证文件即将失效151.14、计费中心长时间未取话单161.15、心跳中断171.16、双机倒换181.17、私网中断191.18、IP资源失效21
2、1.19、备份连接失败221.20、单板故障231.21、许可证即将过期告警241.22、许可证已经过期告警251.23、电源输出开关关闭261.24、H.248 SCTP链路故障271.25、MGW退出服务291.26、MTP目的信令点不可达301.27、MTP路由传输禁止3211.28、MTP链路故障331.29、MTP缓冲区拥塞351.30、M2UA链路故障371.31、SCCP目的信令点禁止381.32、SCCP子系统禁止40N = 联系对端局点确认其子系统是否恢复。422. MGW处理分册422.1 FE级联网口故障422.2 风扇框通讯故障432.3 NET单板时钟检测异常462.
3、4 NET单板时钟失锁492.5 GE级联光口故障512.6 NET单板时钟失锁532.7 NET单板时钟配线故障542.8 级联光口故障562.9 GE通道光模块故障582.10 TDM通道光模块故障613.11 BLU时钟检测异常632.12 信令链路故障告警652.13 SPF扣板链路故障672.14 L2UA链路组故障702.15 L2UA链路故障712.16 单板软件异常告警732.17 SIWF故障告警752.18 控制平面拥塞772.19 单板故障782.20 告警箱断链812.21 单板上存在故障的半永久822.22 参考源丢失842.23 虚拟媒体网关迁移出业务态851. M
4、SC SERVER处理分册 1.1 告警箱处于离线状态告警含义 1. 告警解释 当BAM与告警箱之间通信中断时间超过10秒钟后,系统将产生该告警。 2. 告警参数 无。 对系统的影响 告警箱无法正常运行,不能对BAM发送的告警做出正确响应,如不能发出声光告警。 系统自处理过程 无。 相关告警 无。 告警处理 1. 可能原因 BAM与告警箱之间链路中断。 2. 处理建议 通知分公司维护人员检查BAM和告警箱的连接。1.2、FE端口故障 告警含义 1. 告警解释 系统监测到FE端口出现故障,将产生此告警。 2. 告警参数 参数名称 参数含义 板类型 发生告警FE端口所在单板的类型 框号 该故障端口
5、所在单板的机框号码 槽号 该故障端口所在单板的槽位号码 端口号 FE端口编号 对系统的影响 如果FE端口故障,通过该端口连接的设备之间通信中断。 系统自处理过程 系统的FE通信基于双平面,如果一个端口故障,将另一端口进行通信。 相关告警 无。 告警处理 1. 可能原因 硬件故障。 2. 处理建议 对于WSMU和WIFM板,需要检查网线的连接情况。 对于其它单板,需要检查WHSC板的运行情况。 DSP BRD: FN=1, SLN=2;(输入单板的框号槽号)1.3、WCKI时钟参考源丢失告警含义 1. 告警解释 当WCKI时钟参考源丢失时而产生此告警。 2. 告警参数 参数名称 参数含义 框号
6、WCKI板所在的框号 槽号 WCKI板所在的槽号 丢失时钟源端口号 丢失的时钟参考源号 对系统的影响 可能使系统不能正常工作。 系统自处理过程 时钟参考源丢失,可能导致时钟系统不能正常工作。 相关告警 无。 告警处理 1. 可能原因 外部时钟源工作不正常。 连接外部时钟源的时钟线有问题、或时钟连线不正确 2. 处理建议 1观察设备面板CKI单板BITS时钟输入端口是否正常。2检查外部时钟源是否工作正常,如果不正常,更换时钟源。 3检查时钟线连接是否正确,如果连线正确,请更换时钟线。 1.4、控制框与业务框通信失败告警含义 1. 告警解释 当控制框和业务框之间的通信中断时产生此告警。 2. 告警
7、参数 参数名称 参数含义 框号 框号 对系统的影响 控制框和业务框之间的通信中断。 系统自处理过程 无。 相关告警 无。 告警处理 1. 可能原因 可能控制框与业务框的HSC之间连线不正确 可能业务框工作不正常。 可能业务框没有及时发心跳消息给控制框。 2. 处理建议 1. 检查控制框与业务框的HSC之间的连线是否正确,或更换网线,如果问题解决,这说明是连线有问题。 2. 观察业务框的WSMU板是否运行正常,如果不正常,更换WSMU单板看问题是否解决,如果仍然没有解决更换HSC板,如果仍然没有解决,那可能是背板有问题,需更换背板解决。 3. 检查CPU是否被某个任务长时间占用,导致没有发送心跳
8、消息,或者有网络风暴,导致控制框无法正常接受到消息 1.5、BAM到主机通讯失败告警含义 1. 告警解释 当BAM到主机通讯失败时,系统发出此告警。 2. 告警参数 参数名称 参数含义 模块号 表示与BAM无法通讯的模块号。 对系统的影响 BAM与主机之间无法通讯。 系统自处理过程 无。 相关告警 该告警由ALM-2364 BAM到主机连接中断 引发,ALM-2364 BAM到主机连接中断 表示BAM和交换机断连,因此必然导致该告警的产生。 告警处理 1. 可能原因 交换机有一个框的两个连接都断了。 2. 处理建议 1、检查设备面板是否显示正常,绿色代表正常,灰色代表BAM与主机连接失败。2、
9、检查BAM机器网卡和LAN switchs: 3、检查BAM机器网卡和LAN switchs是否工作正常。并保证所有网线连接正常。告警是否恢复? 1.6、BAM到主机连接中断告警含义 1. 告警解释 当BAM与主机中断时,系统发出此告警。 2. 告警参数 参数名称 参数含义 模块号 表示与BAM无法通讯的模块号。 IP 与BAM连接失败的模块对应的IP地址。 对系统的影响 BAM与主机之间无法通讯。 系统自处理过程 无。 相关告警 该告警连带产生 ALM-2362 BAM到主机通讯失败 。 告警处理 1. 可能原因 交换机某一个框的一个连接断开。 2. 处理建议 1、检查设备面板是否显示正常,
10、绿色代表正常,灰色代表BAM与主机连接失败。2、检查BAM机器网卡和LAN switchs: 3、检查BAM机器网卡和LAN switchs是否工作正常。并保证所有网线连接正常。告警是否恢复? 1.7、与NTP服务器断连告警含义 1. 告警解释 时间同步进程与NTP服务器断连,时间同步已停止。 2. 告警参数 无。 对系统的影响 系统时间无法和NTP服务器同步。 系统自处理过程 无。 相关告警 无。 告警处理 1. 可能原因 NTP服务器被停止或服务被关闭。 系统和NTP服务器之间的网络断连。 2. 处理建议 (1)、在MSOFT3000跟踪维护中用PING NTP服务器IP地址,检查网络是否
11、正常。(2) 检查NTP服务器是否被停止,NTP服务器的时间服务是否被关闭。 (3) 检查系统和NTP服务器之间的网络是否断连。1.8、Q922链路故障告警含义 1. 告警解释 系统单板之间通过Q.922链路进行通信,底层为FE。当两个单板间的Q.922链路发生故障时,产生该告警。 当WSMU启动时,WHSC板会自动被复位,此时也会产生该告警。 2. 告警参数 参数名称 参数含义 源模块号 发出告警的单板的模块号 目的模块号 Q.922链路对端模块号 对系统的影响 使用该链路通信的两个模块之间通信中断。 该链路传输的业务发生中断。 系统自处理过程 无。 相关告警 无。 告警处理 1. 可能原因
12、 Q.922链路发生故障。 WSMU启动。 2. 处理建议 1. 检查是否复位了WSMU板? Y= 正常告警,不用处理 N= 转步骤(2) 2. 检查FE网口的状态是否正常? 观察设备面板HSC端口状态。Y= 转步骤(3) N= 更换不正常状态网口所在的单板 3. 检查单板的运行状态,如果单板发生故障,更换单板。 DSP BRD: FN=1, SLN=2, PSN=FB;(输入HSC单板框号、槽号、前后插板)1.9、TCP链路故障告警含义 1. 告警解释 系统监测到TCP链路出现故障时产生该告警。 WSMU板通过TCP链路与BAM和iGWB进行通信。 2. 告警参数 参数名称 参数含义 模块号
13、 产生该告警的模块号 连接类型 出现故障TCP链路的连接类型,用于定位链路。如到BAM的链路、到iGWB的链路。 对系统的影响 告警模块与目的模块之间的通信中断; 基于该TCP链路的业务中断。 系统自处理过程 无。 相关告警 无。 告警处理 1. 可能原因 网络连接网线故障; 网卡故障。 2. 处理建议 (1) 检查WHSC单板工作状态是否正常? Y=可能为对端设备如BAM、iGWB网卡故障。 N=更换故障单板。 DSP BRD: FN=1, SLN=2, PSN=FB;(输入HSC单板框号、槽号、前后插板)(2) 根据告警参数确认故障链路位置,检查TCP链路两端网卡的指示灯是否正常? Y=请
14、联系华为当地办事处技术支援人员。 N=可能是网线连接问题。(3) 判断是否网线松脱,拔插一下两端的网线接头,确保网线连接正常,检查故障是否排除? Y=网线连接问题,结束。 N=可能是网卡故障。 1.10、CPU过载告警含义 1. 告警解释 单板CPU占用超过设定的阈值(使用命令SET CPUTHD设置)时,产生该告警。 2. 告警参数 参数名称 参数含义 板类型 发生CPU过载的单板的类型 框号 发生CPU过载的单板所在的机框号码 槽号 发生CPU过载的单板所在的槽位号码 位置 该单板在机框中的位置,包括前插板和后插板 过载级别 CPU过载的级别,包括14共四个级别 CPU占用率 告警发生时C
15、PU的占用率。 对系统的影响 部分呼叫会丢弃,产生呼损。 系统自处理过程 系统启动流量控制机制,降低CPU占用率。 相关告警 无。 告警处理 1. 可能原因 系统容量不足; 处理模块分配不合理。 2. 处理建议 (1) 根据告警参数确认发生CPU过载告警的单板,确认是否大部分同类型单板都CPU占用率偏高? 检查该单板的CPU大小:DSP CPUR: LT=MN, MN=2;(输入该单板模块号) (2) 调整业务配置,将过载单板部分业务的调整到其它单板。 1.11、单板网口协商失败告警含义 告警解释 当单板的内网口或外网口以半双工模式工作时产生此告警。 告警参数 参数名称 参数含义 框号 单板所
16、在的框号 槽号 单板所在的槽号 端口号 单板的网口号 3. 举例 参数“框号=0, 槽号=0, 端口号=2”表示位于0框0槽WIFM板的第2个网口(外网口)协商失败。 注意: 系统板和WIFM板配置有3个内部端口,即端口0、1和2。其他单板配置有两个外部端口,即端口0和1。 对系统的影响 BAM与主机之间的以太网数据包不正常丢失,可能导致系统从BAM加载文件失败。 系统自处理过程 无。 告警处理 1. 可能原因 单板起来之后,会和LAN Switch进行网口工作模式协商,如果LAN Switch工作在半双工模式,单板端口也会工作在半双工状态。 2. 处理建议 检查LAN Switch设置,将其
17、设为全双工。 1.13、许可证文件即将失效告警含义 1. 告警解释 许可证在X天后到期。 当以下两种情况中的任意一种发生时将产生此告警: MSC服务器运行在试用许可证模式下。 许可证文件在30天之内到期。 2. 告警参数 参数名称 参数含义 文件名 许可证文件名称 位置 发出告警的位置 剩余天数 许可证文件的剩余有效天数 对系统的影响 许可证文件很快到期。当许可证到期,MSC服务器运行在默认许可证配置下。系统性能会降低。 系统自处理过程 无。 相关告警 1. 伴随告警 无。 2. 引发告警 无。 告警处理 1. 可能原因 许可证文件很快到期。 MSC服务器运行在试用许可证模式。 2. 处理建议
18、 (1)、检查LICENSE状态,确认LICENSE正常使用期限。DSP LICENSE:;输出结果:(2) 请及时购买许可证文件。 1.14、计费中心长时间未取话单告警含义 1. 告警解释 当计费中心长时间不取话单时,产生此告警。 2. 告警参数 参数名称 参数含义 通道号 通道ID 服务器号 0-主机;1-备机 访问点ID 接入点ID 对系统的影响 无。 系统自处理过程 无。 相关告警 1. 伴随告警 无。 2. 引发告警 无。 告警处理 1. 可能原因 与计费中心的连接失败。 2. 处理建议 (1) 检查与计费中心的连接是否正常;(2) 检查FTP或FTAM是否运行正常;(3) 检查计费
19、中心是否运转正常。 1.15、心跳中断告警含义 1. 告警解释 当计费网关双机之间用于心跳的私网、串口均长时间没有接收到对端发送的信号时,产生此告警。 2. 告警参数 参数名称 参数含义 服务器号 0-主机;1-备机 对系统的影响 无。 系统自处理过程 无。 相关告警 1. 伴随告警 无。 2. 引发告警 无。 告警处理 1. 可能原因 双机间用于心跳的串口、私网连接失败。 2. 处理建议 检查双机各自的对端是否在运行,双机之间的串口线、私网线是否连接正确,IP地址设置是否正确。 1.16、双机倒换告警含义 1. 告警解释 当计费网关双机中的激活方无法继续工作时,产生此告警。 2. 告警参数
20、参数名称 参数含义 服务器号 0-主机;1-备机 对系统的影响 无。 系统自处理过程 无。 相关告警 1. 伴随告警 无。 2. 引发告警 无。 告警处理 1. 可能原因 激活方不能正常运行。 2. 处理建议 请检查与此告警伴随的其他告警,并进而排除故障。 1.17、私网中断告警含义 1. 告警解释 当计费网关双机之间用于心跳的私网无法正常通信时,产生此告警。 2. 告警参数 参数名称 参数含义 心跳号 0-私网1;1-私网2 服务器号 0-主机;1-备机 对系统的影响 可能引起同步操作或倒换失败。 系统自处理过程 无。 相关告警 1. 伴随告警 无。 2. 引发告警 无。 告警处理 1. 可
21、能原因 双机之间用于心跳的私网无法正常通信。 2. 处理建议 请根据告警参数检查对应的私网网络,检查IP地址设置是否正确,网线连接是否正确。 1.18、IP资源失效告警含义 1. 告警解释 当计费网关激活方无法使用双机之间的某个虚拟IP时,产生此告警。 2. 告警参数 参数名称 参数含义 IP资源号 虚拟IP的编号 服务器号 0-主机;1-备机 对系统的影响 可能引起与计费中心、主机、网管台的通信失败。 系统自处理过程 无。 相关告警 1. 伴随告警 无。 2. 引发告警 无。 告警处理 1. 可能原因 激活方无法使用双机之间的某个虚拟IP。 2. 处理建议 请根据告警参数检查具体的虚拟IP,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 华为 告警 处理 手册 1.0
限制150内