华为告警处理手册1.0电子教案.doc
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《华为告警处理手册1.0电子教案.doc》由会员分享,可在线阅读,更多相关《华为告警处理手册1.0电子教案.doc(119页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、Good is good, but better carries it.精益求精,善益求善。华为告警处理手册1.0-目录1.MSCSERVER处理分册31.1告警箱处于离线状态31.2、FE端口故障31.3、WCKI时钟参考源丢失41.4、控制框与业务框通信失败51.5、BAM到主机通讯失败71.6、BAM到主机连接中断81.7、与NTP服务器断连91.8、Q922链路故障101.9、TCP链路故障111.10、CPU过载121.11、单板网口协商失败141.13、许可证文件即将失效151.14、计费中心长时间未取话单161.15、心跳中断171.16、双机倒换181.17、私网中断191.1
2、8、IP资源失效211.19、备份连接失败221.20、单板故障231.21、许可证即将过期告警241.22、许可证已经过期告警251.23、电源输出开关关闭261.24、H.248SCTP链路故障271.25、MGW退出服务291.26、MTP目的信令点不可达301.27、MTP路由传输禁止3211.28、MTP链路故障331.29、MTP缓冲区拥塞351.30、M2UA链路故障371.31、SCCP目的信令点禁止381.32、SCCP子系统禁止40N=联系对端局点确认其子系统是否恢复。422.MGW处理分册422.1FE级联网口故障422.2风扇框通讯故障432.3NET单板时钟检测异常4
3、62.4NET单板时钟失锁492.5GE级联光口故障512.6NET单板时钟失锁532.7NET单板时钟配线故障542.8级联光口故障562.9GE通道光模块故障582.10TDM通道光模块故障613.11BLU时钟检测异常632.12信令链路故障告警652.13SPF扣板链路故障672.14L2UA链路组故障702.15L2UA链路故障712.16单板软件异常告警732.17SIWF故障告警752.18控制平面拥塞772.19单板故障782.20告警箱断链812.21单板上存在故障的半永久822.22参考源丢失842.23虚拟媒体网关迁移出业务态851.MSCSERVER处理分册1.1告警箱
4、处于离线状态告警含义1.告警解释当BAM与告警箱之间通信中断时间超过10秒钟后,系统将产生该告警。2.告警参数无。对系统的影响告警箱无法正常运行,不能对BAM发送的告警做出正确响应,如不能发出声光告警。系统自处理过程无。相关告警无。告警处理1.可能原因BAM与告警箱之间链路中断。2.处理建议通知分公司维护人员检查BAM和告警箱的连接。1.2、FE端口故障告警含义1.告警解释系统监测到FE端口出现故障,将产生此告警。2.告警参数参数名称参数含义板类型发生告警FE端口所在单板的类型框号该故障端口所在单板的机框号码槽号该故障端口所在单板的槽位号码端口号FE端口编号对系统的影响如果FE端口故障,通过该
5、端口连接的设备之间通信中断。系统自处理过程系统的FE通信基于双平面,如果一个端口故障,将另一端口进行通信。相关告警无。告警处理1.可能原因硬件故障。2.处理建议对于WSMU和WIFM板,需要检查网线的连接情况。对于其它单板,需要检查WHSC板的运行情况。DSPBRD:FN=1,SLN=2;(输入单板的框号槽号)1.3、WCKI时钟参考源丢失告警含义1.告警解释当WCKI时钟参考源丢失时而产生此告警。2.告警参数参数名称参数含义框号WCKI板所在的框号槽号WCKI板所在的槽号丢失时钟源端口号丢失的时钟参考源号对系统的影响可能使系统不能正常工作。系统自处理过程时钟参考源丢失,可能导致时钟系统不能正
6、常工作。相关告警无。告警处理1.可能原因 外部时钟源工作不正常。 连接外部时钟源的时钟线有问题、或时钟连线不正确2.处理建议1观察设备面板CKI单板BITS时钟输入端口是否正常。2检查外部时钟源是否工作正常,如果不正常,更换时钟源。3检查时钟线连接是否正确,如果连线正确,请更换时钟线。1.4、控制框与业务框通信失败告警含义1.告警解释当控制框和业务框之间的通信中断时产生此告警。2.告警参数参数名称参数含义框号框号对系统的影响控制框和业务框之间的通信中断。系统自处理过程无。相关告警无。告警处理1.可能原因 可能控制框与业务框的HSC之间连线不正确 可能业务框工作不正常。 可能业务框没有及时发心跳
7、消息给控制框。2.处理建议1. 检查控制框与业务框的HSC之间的连线是否正确,或更换网线,如果问题解决,这说明是连线有问题。2. 观察业务框的WSMU板是否运行正常,如果不正常,更换WSMU单板看问题是否解决,如果仍然没有解决更换HSC板,如果仍然没有解决,那可能是背板有问题,需更换背板解决。3. 检查CPU是否被某个任务长时间占用,导致没有发送心跳消息,或者有网络风暴,导致控制框无法正常接受到消息1.5、BAM到主机通讯失败告警含义1.告警解释当BAM到主机通讯失败时,系统发出此告警。2.告警参数参数名称参数含义模块号表示与BAM无法通讯的模块号。对系统的影响BAM与主机之间无法通讯。系统自
8、处理过程无。相关告警该告警由ALM-2364BAM到主机连接中断引发,ALM-2364BAM到主机连接中断表示BAM和交换机断连,因此必然导致该告警的产生。告警处理1.可能原因交换机有一个框的两个连接都断了。2.处理建议1、检查设备面板是否显示正常,绿色代表正常,灰色代表BAM与主机连接失败。2、检查BAM机器网卡和LANswitchs:3、检查BAM机器网卡和LANswitchs是否工作正常。并保证所有网线连接正常。告警是否恢复?1.6、BAM到主机连接中断告警含义1.告警解释当BAM与主机中断时,系统发出此告警。2.告警参数参数名称参数含义模块号表示与BAM无法通讯的模块号。IP与BAM连
9、接失败的模块对应的IP地址。对系统的影响BAM与主机之间无法通讯。系统自处理过程无。相关告警该告警连带产生ALM-2362BAM到主机通讯失败。告警处理1.可能原因交换机某一个框的一个连接断开。2.处理建议1、检查设备面板是否显示正常,绿色代表正常,灰色代表BAM与主机连接失败。2、检查BAM机器网卡和LANswitchs:3、检查BAM机器网卡和LANswitchs是否工作正常。并保证所有网线连接正常。告警是否恢复?1.7、与NTP服务器断连告警含义1.告警解释时间同步进程与NTP服务器断连,时间同步已停止。2.告警参数无。对系统的影响系统时间无法和NTP服务器同步。系统自处理过程无。相关告
10、警无。告警处理1.可能原因 NTP服务器被停止或服务被关闭。 系统和NTP服务器之间的网络断连。2.处理建议(1)、在MSOFT3000跟踪维护中用PINGNTP服务器IP地址,检查网络是否正常。(2)检查NTP服务器是否被停止,NTP服务器的时间服务是否被关闭。(3)检查系统和NTP服务器之间的网络是否断连。1.8、Q922链路故障告警含义1.告警解释系统单板之间通过Q.922链路进行通信,底层为FE。当两个单板间的Q.922链路发生故障时,产生该告警。当WSMU启动时,WHSC板会自动被复位,此时也会产生该告警。2.告警参数参数名称参数含义源模块号发出告警的单板的模块号目的模块号Q.922
11、链路对端模块号对系统的影响 使用该链路通信的两个模块之间通信中断。 该链路传输的业务发生中断。系统自处理过程无。相关告警无。告警处理1.可能原因 Q.922链路发生故障。 WSMU启动。2.处理建议1. 检查是否复位了WSMU板?Y=正常告警,不用处理N=转步骤(2)2. 检查FE网口的状态是否正常?观察设备面板HSC端口状态。Y=转步骤(3)N=更换不正常状态网口所在的单板3. 检查单板的运行状态,如果单板发生故障,更换单板。DSPBRD:FN=1,SLN=2,PSN=FB;(输入HSC单板框号、槽号、前后插板)1.9、TCP链路故障告警含义1.告警解释系统监测到TCP链路出现故障时产生该告
12、警。WSMU板通过TCP链路与BAM和iGWB进行通信。2.告警参数参数名称参数含义模块号产生该告警的模块号连接类型出现故障TCP链路的连接类型,用于定位链路。如到BAM的链路、到iGWB的链路。对系统的影响 告警模块与目的模块之间的通信中断; 基于该TCP链路的业务中断。系统自处理过程无。相关告警无。告警处理1.可能原因 网络连接网线故障; 网卡故障。2.处理建议(1)检查WHSC单板工作状态是否正常?Y=可能为对端设备如BAM、iGWB网卡故障。N=更换故障单板。DSPBRD:FN=1,SLN=2,PSN=FB;(输入HSC单板框号、槽号、前后插板)(2)根据告警参数确认故障链路位置,检查
13、TCP链路两端网卡的指示灯是否正常?Y=请联系华为当地办事处技术支援人员。N=可能是网线连接问题。(3)判断是否网线松脱,拔插一下两端的网线接头,确保网线连接正常,检查故障是否排除?Y=网线连接问题,结束。N=可能是网卡故障。1.10、CPU过载告警含义1.告警解释单板CPU占用超过设定的阈值(使用命令SETCPUTHD设置)时,产生该告警。2.告警参数参数名称参数含义板类型发生CPU过载的单板的类型框号发生CPU过载的单板所在的机框号码槽号发生CPU过载的单板所在的槽位号码位置该单板在机框中的位置,包括前插板和后插板过载级别CPU过载的级别,包括14共四个级别CPU占用率告警发生时CPU的占
14、用率。对系统的影响部分呼叫会丢弃,产生呼损。系统自处理过程系统启动流量控制机制,降低CPU占用率。相关告警无。告警处理1.可能原因 系统容量不足; 处理模块分配不合理。2.处理建议(1)根据告警参数确认发生CPU过载告警的单板,确认是否大部分同类型单板都CPU占用率偏高?检查该单板的CPU大小:DSPCPUR:LT=MN,MN=2;(输入该单板模块号)(2)调整业务配置,将过载单板部分业务的调整到其它单板。1.11、单板网口协商失败告警含义告警解释当单板的内网口或外网口以半双工模式工作时产生此告警。告警参数参数名称参数含义框号单板所在的框号槽号单板所在的槽号端口号单板的网口号3. 举例参数“框
15、号=0,槽号=0,端口号=2”表示位于0框0槽WIFM板的第2个网口(外网口)协商失败。注意:系统板和WIFM板配置有3个内部端口,即端口0、1和2。其他单板配置有两个外部端口,即端口0和1。对系统的影响BAM与主机之间的以太网数据包不正常丢失,可能导致系统从BAM加载文件失败。系统自处理过程无。告警处理1. 可能原因单板起来之后,会和LANSwitch进行网口工作模式协商,如果LANSwitch工作在半双工模式,单板端口也会工作在半双工状态。2. 处理建议检查LANSwitch设置,将其设为全双工。1.13、许可证文件即将失效告警含义1.告警解释许可证在X天后到期。当以下两种情况中的任意一种
16、发生时将产生此告警: MSC服务器运行在试用许可证模式下。 许可证文件在30天之内到期。2.告警参数参数名称参数含义文件名许可证文件名称位置发出告警的位置剩余天数许可证文件的剩余有效天数对系统的影响许可证文件很快到期。当许可证到期,MSC服务器运行在默认许可证配置下。系统性能会降低。系统自处理过程无。相关告警1.伴随告警无。2.引发告警无。告警处理1.可能原因 许可证文件很快到期。 MSC服务器运行在试用许可证模式。2.处理建议(1)、检查LICENSE状态,确认LICENSE正常使用期限。DSPLICENSE:;输出结果:(2)请及时购买许可证文件。1.14、计费中心长时间未取话单告警含义1
17、.告警解释当计费中心长时间不取话单时,产生此告警。2.告警参数参数名称参数含义通道号通道ID服务器号0-主机;1-备机访问点ID接入点ID对系统的影响无。系统自处理过程无。相关告警1.伴随告警无。2.引发告警无。告警处理1.可能原因与计费中心的连接失败。2.处理建议(1)检查与计费中心的连接是否正常;(2)检查FTP或FTAM是否运行正常;(3)检查计费中心是否运转正常。1.15、心跳中断告警含义1.告警解释当计费网关双机之间用于心跳的私网、串口均长时间没有接收到对端发送的信号时,产生此告警。2.告警参数参数名称参数含义服务器号0-主机;1-备机对系统的影响无。系统自处理过程无。相关告警1.伴
18、随告警无。2.引发告警无。告警处理1.可能原因双机间用于心跳的串口、私网连接失败。2.处理建议检查双机各自的对端是否在运行,双机之间的串口线、私网线是否连接正确,IP地址设置是否正确。1.16、双机倒换告警含义1.告警解释当计费网关双机中的激活方无法继续工作时,产生此告警。2.告警参数参数名称参数含义服务器号0-主机;1-备机对系统的影响无。系统自处理过程无。相关告警1.伴随告警无。2.引发告警无。告警处理1.可能原因激活方不能正常运行。2.处理建议请检查与此告警伴随的其他告警,并进而排除故障。1.17、私网中断告警含义1.告警解释当计费网关双机之间用于心跳的私网无法正常通信时,产生此告警。2
19、.告警参数参数名称参数含义心跳号0-私网1;1-私网2服务器号0-主机;1-备机对系统的影响可能引起同步操作或倒换失败。系统自处理过程无。相关告警1.伴随告警无。2.引发告警无。告警处理1.可能原因双机之间用于心跳的私网无法正常通信。2.处理建议请根据告警参数检查对应的私网网络,检查IP地址设置是否正确,网线连接是否正确。1.18、IP资源失效告警含义1.告警解释当计费网关激活方无法使用双机之间的某个虚拟IP时,产生此告警。2.告警参数参数名称参数含义IP资源号虚拟IP的编号服务器号0-主机;1-备机对系统的影响可能引起与计费中心、主机、网管台的通信失败。系统自处理过程无。相关告警1.伴随告警
20、无。2.引发告警无。告警处理1.可能原因激活方无法使用双机之间的某个虚拟IP。2.处理建议请根据告警参数检查具体的虚拟IP,检查网络中是否已经存在相同的IP。1.19、备份连接失败告警含义1.告警解释当计费网关侦测到连接目的机失败时,产生此告警。2.告警参数参数名称参数含义备份任务号备份任务序列号服务器号0-主机;1-备机对系统的影响无。系统自处理过程无。相关告警1.伴随告警无。2.引发告警无。告警处理1.可能原因计费网关与目的机之间的连接不正常。2.处理建议检查计费网关与目的机之间是否连接正常。1.20、单板故障告警含义1.告警解释当系统检测到单板板故障时,产生此告警。故障单板包括:WSMU
21、、WMGC、WCCU、WCSU、WCDB、WVDB、WBSG、WIFM、WALU、CPC、WEPI、WCKI2.告警参数参数名称参数含义板类型发生告警单板的类型框号该故障单板所在的机框号码槽号该故障单板所在的槽位号码对系统的影响系统自处理过程 该单板会重启;相关告警。告警处理1.可能原因 单板发生故障; 单板复位。2.处理建议1. 根据告警参数确认该故障单板的位置,检查该单板是否松动,如果松动插紧该单板。2. 打开操作维护系统的设备面板,查看该单板的运行状态(或者使用命令DSPBRD:FN=1,SLN=2,PSN=FB;),复位该单板,查看故障是否排除?3. 插拔该单板,进行硬件复位,查看故障
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 华为 告警 处理 手册 1.0 电子 教案
![提示](https://www.deliwenku.com/images/bang_tan.gif)
限制150内