《系统运行维护操作介绍及其说明书.doc》由会员分享,可在线阅读,更多相关《系统运行维护操作介绍及其说明书.doc(37页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、-_xxxx 系统系统运维操作手册运维操作手册xxxx 公司二零零九年十月-_版本控制版本控制版本号版本号日期日期参与人员参与人员更新说明更新说明1.02011-06-06创建分发控制分发控制编号编号读者读者文档权限文档权限与文档的主要关系与文档的主要关系1创建、修改、读取负责编制、修改、审核2批准负责本文档的批准程序3标准化审核作为本项目的标准化负责人,负 责对本文档进行标准化审核4读取5读取-_1概述概述.52 2主机系统主机系统.62.1检查文件系统利用率.6 2.2查看系统硬件软件告警日志.6 2.3检查僵死或运行时间过长的进程.7 2.4检查系统 CPU 利用率.8 2.5检查系统内
2、存利用率.8 2.6检查系统 IO 利用率.9 2.7检查系统交换量.10 2.8检查系统高可用性(HA)的使用状态.10 2.9清理过时的系统临时文件.11 2.10检查磁带库和磁带使用情况.11 2.11修改用户口令.12 2.12清洗磁带机.12 2.13检索操作系统日志.133系统启动与关闭系统启动与关闭.143.1系统的运行架构.14 3.2系统的启动.15 3.3系统的关闭.184系统部署系统部署.244.1生成部署包.24 4.2程序部署.285重要的系统参数配置重要的系统参数配置.415.1CONFIG.PROPERTIES.41 5.2SPRING-MISTASK.XML.4
3、16日志查看日志查看.436.1WAS 日志.43 6.2DB2 日志.437查系统是否正确运行查系统是否正确运行.458系统管理员维护人员信息日志系统管理员维护人员信息日志.479查看表空间及附件硬盘的使用情况查看表空间及附件硬盘的使用情况.489.1DB2 表空间查看 .48 9.2115 服务器附件文件占用情况.4810服务停启顺序服务停启顺序.50-_1 概述概述本手册给出了湖南省移动公司的报账平台系统及报账平台外围系统的运维操作细则。手册从主机系统、应用系统以及数据库系统三个方面对任务项进行组织,对应章节包括第 Error! Reference source not found.章报
4、账平台主机系统,第 Error! Reference source not found.章报账平台应用软件系统以及第 Error! Reference source not found.章报账平台数据库系统。每个任务项中可能涉及的表格将在第 5 章表单模板中统一给出。-_2 2 主机系统主机系统2.1 检查文件系统利用率检查文件系统利用率编 号名 称检查文件系统利用率描 述此任务检查文件系统利用率不低于 85%或有大于 0.5G 以上的空闲空间操作角色主机系统 管理员所属管控类别巡检执行频度每日操作说明1. 系统的正常运行应保证有足够的磁盘空间,文件系统被写满会导致 系统服务的中断,可以使用
5、df k 进行检查是否有文件系统利用率 高于 85%并且可用空间小于 500M,对于保存数据库数据文件所在的 磁盘空间和保存归档日志的应有更高的空闲空间。 2. 但也不可以盲目的扩展文件系统,因为目前 31 省所使用的文件系统 均不可以缩小,如果要回收空间只能删除重建表单填写参见表单模板中的巡检单表格-_2.2 查看系统硬件软件告警日志查看系统硬件软件告警日志编 号名 称查看系统硬件软件告警日志描 述此任务查看系统硬件软件告警日志操作角色主机系统 管理员所属管控类别巡检执行频度每日操作说明以 root 运行 tail /var/adm/messages 查看,如果系统写满了一个 message
6、 文件会自动备份为 message.0, message.1 等。表单填写参见表单模板中的巡检单表格2.3 检查僵死或运行时间过长的进程检查僵死或运行时间过长的进程编 号名 称检查僵死或运行时间过长的进程描 述此任务查看检查僵死或运行时间过长的进程操作角色主机系统 管理员所属管控类别巡检执行频度每日-_操作说明1. 使用 ps ef|grep applprd 和 ps ef |grep oraprd 进行检查 (运行时间超过 12 小时的绝大部分是需要注意的进程) 。 2. 而程序名为 defunct 的均为孤儿或僵死进程。 3. 由于,夜晚为非工作时间,因此运行超过 12 个小时的应用服务例
7、如, form 服务的客户端进程(AIX 平台为 f60runm,SUN 平台为 f60webmx) ,很可能是运行出错的进程,应可以 kill 掉,对于数据 库进程一般不采用在 UNIX 命令中 kill 的方法而是登陆到数据库使用 alter system kill session ,的方法中止 该数据库进程。表单填写参见表单模板中的巡检单表格2.4 检查系统检查系统 CPU 利用率利用率编 号名 称检查系统 CPU 利用率描 述此任务检查系统 CPU 利用率-_操作角色主机系统 管理员所属管控类别巡检执行频度每日操作说明1.prstat a solaris 2. psrinfo -v (
8、CPU 状态)表单填写参见表单模板中的巡检单表格2.5 检查系统内存利用率检查系统内存利用率编 号名 称检查系统内存利用率描 述此任务检查内存利用率操作角色主机系统 管理员所属管控类别巡检执行频度每日-_操作说明1.solaris vmstat 查看 free 值 2.prtdiag -v表单填写参见表单模板中的巡检单表格2.6 检查系统检查系统 IO 利用率利用率编 号名 称检查系统 IO 利用率描 述此任务检查 IO 利用率操作角色主机系统 管理员所属管控类别巡检执行频度每日-_操作说明1.solaris iostat表单填写参见表单模板中的巡检单表格2.7 检查系统交换量检查系统交换量编
9、 号名 称检查系统交换量描 述此任务检查系统交换量操作角色主机系统 管理员所属管控类别巡检执行频度每日-_操作说明1. 手动运行的方法如下: topas2.swap l & swap s solaris表单填写参见表单模板中的巡检单表格2.8 检查系统高可用性(检查系统高可用性(HA)的使用状态)的使用状态编 号名 称检查系统高可用性(HA)的使用状态描 述此任务检查系统高可用性(HA)的使用状态操作角色主机系统 管理员所属管控类别巡检执行频度每日-_操作说明表单填写参见表单模板中的巡检单表格2.9 清理过时的系统临时文件清理过时的系统临时文件编 号名 称清理过时的系统临时文件描 述此任务清理
10、过时的系统临时文件操作角色主机系统 管理员所属管控类别巡检执行频度每周操作说明1. f60*dump*。 2. $ORACLE_HOME/reports60/server/cache/*(最好关闭服务 清理) 。 3. $APPLTMP/*(只有关闭服务后可以进行) 。1.webview 状态# /etc/opt/FJSVwvbs/etc/bin/wvstat2.CF 和心跳状态# cftool - 和 cftool -r3.SF 状态# sdtool -s 4.CIP 状态# ciptool -a 和 # ciptool -n5.CRM 状态# /etc/opt/FJSVcluster/bi
11、n/clgettree 6.RMS 状态# hvdisp -a 1.-_表单填写参见表单模板中的巡检单表格2.10 检查磁带库和磁带使用情况检查磁带库和磁带使用情况编 号名 称检查磁带库和磁带使用情况描 述此任务检查磁带库和磁带使用情况操作角色主机系统 管理员所属管控类别巡检执行频度每周操作说明1. 检查是否有足够的空间保存备份。 2. 磁带库运行中是否有错误出现。-_表单填写参见表单模板中的巡检单表格2.11 修改用户口令修改用户口令编 号名 称修改 UNIX 用户口令描 述此项目修改用户口令操作角色主机系统 管理员所属管控类别用户帐号及 密码管理执行频度每月操作说明1. 修改 UNIX 密
12、码步骤如下:letterboxusername1: passwdEnter login password: 您的旧密码New password: 您的新密码Re-enter new password: 您的新密码passwd (SYSTEM): passwd successfully changed for usernameletterboxusername2:2.密码修改之后,必须及时通知系统管理员。修改过 UNIX 口令之后,需要通知需要知道口令的人员。-_表单填写参见表单模板中的用户帐号管理情况登记表2.12 清洗磁带机清洗磁带机编 号名 称清洗磁带机描 述此任务将清洗磁带机清洗干净操作
13、角色主机系统 管理员所属管控类别备份管理执行频度每月操作说明用清洗带清洗磁带机。-_表单填写参见表单模板中的巡检单表格2.13 检索操作系统日志检索操作系统日志编 号名 称检索 AIX 操作系统日志描 述此任务检索操作系统日志操作角色主机系统 管理员所属管控类别日志管理执行频度每周操作说明1查看用户登陆日志:查看用户登陆日志: 在命令行输入命令:last 2查看用户失败登陆日志:查看用户失败登陆日志:在命令行输入命令,进入日志所在目录:cd /etc/security查看日志内容: vi failedlogin 3查看查看 su 命令执行日志内容:命令执行日志内容: 在命令行输入命令,进入日志
14、所在目录:cd /var/adm 查看日志内容:vi sulog 4查看查看 Auditor 文件操作日志文件操作日志 首先需要在系统中开启 audit 功能,会在系统中自动生成 /etc/security/audit/bin*文件。此处的 bin*指所有以 bin 开头的文件 进入日志所在目录:cd /etc/security/audit/ 查看日志: vi bin*-_表单填写参见表单模板中日志检索申请表及日志检索记录表根据情况可能需要备份介质访问登记表-_3 系统启动与关闭系统启动与关闭3.1 系统的运行架构系统的运行架构3.2 系统的启动系统的启动编 号名 称检查系统启动描 述此任务查
15、看系统登录以了解应用系统此时此刻的运行状况操作角色应用系统 管理员所属管控类别巡检执行频度系统更改操作说明第一步: 第二步:挂接 NFS:第三步:启动其他软件,-_表单填写参见表单模板中的巡检单表格输入用户名 root 和 root 的密码,点击 OK。选择 Global Cluster Service;选择 Cluster Admin,选择其中的任意一个节点,如 dbsvr;选择 rms 标签页,在 Tools 菜单中选择启动;-_启动后的状态如下图所示:3.3 系统的关闭系统的关闭编 号名 称系统关闭描 述此任务查看系统关闭操作角色应用系统 管理员所属管控类别巡检执行频度系统更改操作说明第
16、一步: 第二步:关闭其他软件这样,应用就关闭完成了。-_表单填写参见表单模板中的巡检单表格输入用户名 root 和 root 的密码,点击 OK。选择 Global Cluster Service;-_选择 Cluster Admin,选择其中的任意一个节点,如 dbsvr;选择 rms 标签页,在 Tools 菜单中选择关闭;根据需要,选择 stop all Apps。关闭完成后,如下图所示:-_4 系统部署系统部署4.1 生成部署包生成部署包首先,需要更新 SVN 上的版本,在版本管理机器 F:ProductSpecialSrc1128src 下,选定下面的文件,按右键,选择 update
17、:F:ProductSpecialSrc1128WebRoot 下,选定下面的文件,按右键,选择 update:进入 Eclipse:查看项目属性,确实为 F:ProductSpecialSrc1128 的项目:在项目上按右键,选择 Refresh。在 Project 菜单,选择 Clean:待 Clean 完成后,在 File 菜单选择 Export,选择 War file:-_导出到一个文件夹:这样,部署包就生成了。4.2 程序部署程序部署登录到:http:/10.154.140.115:9060/ibm/console/输入用户名,可输入 root:选择应用程序企业应用程序,选定 eFi
18、nance.war,点击停止:待停止完成后,选择 eFinance.war,点击删除:点击确定:点击保存:点击安装:-_点击浏览,选定部署包:输入上下文根: eFinance ,点击下一步:点击下一步:选定所有集群和服务器,选定 ent_bpms,点击应用;选定 ent_bpms,点击下一步:点击完成:点击保存:部署包已经部署完成,如下图所示:-_下一步的任务是启动应用程序。点击集群:选择 Cluster,点击停止:待选择 Cluster,点击启动:启动完成后,如下图所示:启动完成后,进行验证:http:/10.154.140.116/eFinance-_5 重要的系统参数配置重要的系统参数配
19、置-_6 日志查看日志查看6.1 WAS 日志日志编 号名 称检查 WAS 日志描 述此任务查看WAS 日志状况操作角色应用系统 管理员所属管控类别巡检执行频度每日操作说明1Wassvr 日志存放于:/opt/IBM/WebSphere/AppServer/profiles/AppSrv01/logs/wassvr2dbsvr 日志存放于/opt/IBM/WebSphere/AppServer/profiles/AppSrv01/logs/dbsvr-_表单填写参见表单模板中的巡检单表格6.2 DB2 日志日志编 号名 称检查 DB2 日志描 述此任务查看DB2 日志状况操作角色应用系统 管理
20、员所属管控类别巡检执行频度每日-_操作说明1Db2 日志存放与 dbsvr 服务器的:/ef/appinst/sqllib/db2dump表单填写参见表单模板中的巡检单表格-_7 查系统是否正确运行查系统是否正确运行编 号名 称检查系统登录描 述此任务查看系统登录以了解应用系统此时此刻的运行状况操作角色应用系统 管理员所属管控类别巡检执行频度每日操作说明1. 如果页面能正常显示,说明 115 服务器或 117 服务器运行正常 如图所 示:检查登录页面公司参照列表是否能正常显示所有公司 2. 检查是否能正常登陆-_表单填写参见表单模板中的巡检单表格115 服务器运行页面:117 服务器运行页面:
21、-_8 系统管理员维护人员信息日志系统管理员维护人员信息日志当管理员登录后可以看到如下图所示的页面:您可以先点击 :系统管理员专区(用红色的框标出)进入相应的页面后,可以看到一个 日志管理(用红色的框标出) 的菜单,点击日志管理就可以查询相应的历史人员维护信息。-_9 查看表空间及附件硬盘的使用情况查看表空间及附件硬盘的使用情况9.1 Db2 表空间查看表空间查看编 号名 称检查 DB2 表空间情况描 述此任务查看DB2 表空间情况操作角色应用系统 管理员所属管控类别巡检执行频度每日操作说明1.登录 117dbserver,进入到 db2cmd 命令格式下,链接到数据库下使用 list tablespase show detail 命令查看数据表使用情况,空间是否快满。-_表单填写参见表单模板中的巡检单表格9.2 115 服务器附件文件占用情况服务器附件文件占用情况编 号名 称检查 115 服务器附件文件占用情况描 述此任务查看115 服务器附件文件占用情况操作角色应用系统 管理员所属管控类别巡检执行频度每日-_操作说明1Telnet 到 115 服务器,使用 df h 命令查看 attachment 文件目录的占用 情况,以便及时扩容快满的硬盘表单填写参见表单模板中的巡检单表格-_10服务停启顺序服务停启顺序
限制150内