软件公司维护项目作业指导书
1 总则
1.1 本公司为求增进经营效能,加强售后服务工作,特制定本指导书
1.2 本指导书包括总则、服务作业流程等内容
1.3 售后技术支持部为本公司售后的策划部门,与客户服务中心保持直接及密切的联系,对服务工作处理的核定依公司权责划分处理。
2 维护工作流程
3 程序
3.1 维护信息来源
当客户服务中心接收到客户维护请求时,应详细记录客户所反映的问题,然后立刻转交给售后技术支持部门,技术总监将指定负责工程师进行维护。
3.2 维护过程
3.2.1 客服中心在接到客户的维护请求后,在《客户维护请求记录》上详细记录客户发生的问题、时间、严重性,并进行判断,如电话或E-mail可以解决的,由售后技术支持工程师及时告诉客户解决方案,直到客户满意为止。如需到现场服务解决的,应尽快向技术支持总监汇报,由他指定负责工程师,共同分析问题原因,设计解决计划和实施方案。
3.2.2 维护工程师在现场维护时,首先要做好客户数据的备份,然后着手解决问题,维护过程应详细记录在《维护巡检记录》上,当时解决与否,事后均应由客户代表签字确认。
3.2.3 对于软件二次开发的问题,客服中心根据《客户维护记录》,交给相应软件开发人员处理。
3.3 维护方式及内容
3.3.1 维护方式
a) 热线支持:工程师通过电话向用户提供技术问题解答过程。
b) WEB支持:通过在线支持系统接收、解答用户问题,并在网上发布相关技术建设问答的过程。
c) 远程维护:技术支持部门派遣工程师到用户现场解决问题的过程。
d) 信函、传真服务:通过信函和传真,为用户解答用户提出的问题。
e) 回访服务:由工程师主动开展回访用户服务。
f) 软件更版:指由于软件出现故障而对软件进行优化、换代的过程。
g) 软件升级:指由于对软件增加新功能或为了适应新的操作系统而对软件进行的优化、换代过程。
h) IT外包:为了保障用户正常使用公司软件而向用户提供所有相关软硬件支持服务的过程。
i) 平台维护:指对保证公司产品正常运行的相关软件环境进行保养、调试、设配的过程。
3.3.2 作业指导书
维护项目涉及网络设备、主机系统、数据库系统和其他应用软件的安装,详细请参见附件。
3.4 维护记录和维护报告
3.4.1 维护工程师维护完成后应将处理过程及结果详细记录在《维护巡检报告》和《工程日志》。
3.4.2 技术总监没季度需对本部门的维护活动进行总结,形成《维护报告》。
3.4.3 客户服务中心对每次维护工作进行抽查并将客户意见反馈给技术支持部。
3.5 维护工作结束后,负责工程师将撰写《维护巡检报告》、《维护任务单》、《工程日记》、《缺坏件报告》,并向技术总监和客服中心提交,相关技术资料将发布到“技术知识库”存档。
3.6 技术知识库包括《系统安装手册》、《维护手册》等各类技术文档等,以web形式存放。
4.相关文件
5.质量记录
《维护巡检报告》
《维护任务单》
《工程日记》
《缺坏件报告》
《客户维护请求记录》
附件1:
主机系统维护作业指导书
一、主机系统日常维护内容
1. 检查硬盘指示灯,若亮绿灯为正常,亮黄灯或红灯则为异常。
2. 检查电源指示灯,若亮绿灯为正常,亮黄灯或红灯则为异常。检查各电源线是否有松动,是否发热。
3. 检查各主机外观,查看前面板是否完整良好。
4. 检查主机散热风扇运转情况,用手感觉出风口,有风则正常;检查风扇是否无杂音。
5. 检查磁盘阵列:查看阵列硬盘指示灯,亮绿灯为正常,若亮黄灯或红灯则为异常;查看散热风扇是否正常,用手感觉出风口,有风则正常;查看电源指示灯是否为绿,为绿正常,为红则异常。
6. 检查网卡指示灯,亮绿灯为正常,若亮黄灯、红灯或不亮则为异常。
7. 检查网线是否有松动,断线的情况。
8. 运行系统程序检查。
二、维护操作指南
1) 日常硬件巡检
2) 日常软件巡检
l 查看操作系统的版本
l 查看系统资源
l 查看磁盘空间
l 查看系统配置文件
l 增加文件系统的空间大小
l 查看内存的大小
l 查看物理硬盘
l 补丁程序是否满足稳定运行的需要
三、故障处理流程和指南
一、现象:系统无法正常开机,加电后无任何反应。
处理流程:
1、 检查机器的插座部分是否有电,确认有电后,检查主机的电源线,电线接口部分是否正常;
2、 如果正常,将主机的电源插头拔下,过几分钟后插上开机;
3、 如仍无法正常开机,则检查机器最近是否更换及改动过某些部件,例如增加或者减少内存,更改了内存在插槽上的位置,如果内存或内存插槽损坏,也会导致机器无法加电;
4、 查看机器面板LCD,根据LCD的报错数字信息进行相应处理;如不能处理,把报错数字信息通知厂家维护工程师,进行检修。
5、 排除以上因素后故障依然存在,则可能是机内电源或者主板故障,应通知厂家维护工程师进行检修。
二、现象:显示器无显示
处理流程:
1、 首先检查计算机与显示器的连线是否接好,确认显示器电源插头通电,检查显卡有无松动或插头是否插紧;
2、 如果故障依然存在,更换显示器或显卡试试,同时,内存松动或损坏也会导致显示器无显示。
3、 查看机器面板LCD,根据LCD的报错数字信息进行相应处理;如不能处理,刚把报错数字信息通知厂家维护工程师,进行检修。
4、 排除以上因素后故障依然存在,则可能是机内电源或者主板故障,应通知厂家维护工程师进行检修。
三、现象:无法使用网络
处理流程:
1、 用netstat –r察看流资源是否用尽;
2、 检查网线是否插好,网线的制作以及类型是否正确;
3、 驱动程序安装是否正确,重链内核是否完整,必要时可重装驱动,如果仍然不通,可更换网卡试试;
4、 确认操作系统和路由设定是否正确;
5、 排除以上因素后故障依然存在,则应通知厂家维护工程师进行检修。
四维护记录
1. 机房环境:电源电压_______ □符合要求 □不符合; 零地电压_______ □符合要求 □不符合
温度、湿度 □符合要求 □不符合
2. 检查系统硬件情况:设备故障灯是否有亮 □有 □无; 有其他否异常情况 □有 □无
3. 系统错误报告(Error Log): 有否硬件故障 □有 □无
有否软件故障 □有 □无
有否发给root用户的错误报告(mail): □有 □无
机器清洁(根据需要清洁机器各部件) □已清洁 □不需要
4. 检查日志文件等 □正常 □不正常
5. 文件系统:有否“满”的文件系统 □有 □无
6. 内存交换区:使用率是否超过70% □是 □否
7. 系统性能:有否性能瓶颈 □有 □无
8. 备份:有否合符要求的系统备份 □有 □无 最近一次系统备份的时间_________
有否符合要求的用户数据备份 □有 □无
磁带机是否需要清洗 □需要 □不需
9. 通信:网卡的状态、IP地址、路由表等 □正常 □不正常
网卡通信(ping) □正常 □不正常
/etc/hosts文件或DNS设置 □正常 □不正常
10. 用户数据是否已作保护 □所有数据 □部分数据 □没有保护
数据保护方式为: □RAID-1 □RAID-5 □RAID-10 □逻辑卷镜像 □逻辑卷0+1
磁盘阵列RAID盘的状态:□Good □Degraded □Failed □Cache打开 □Cache关闭
11. 其他软件测试: □正常 □不正常; 相关参数设置检查: □正常
12. 系统硬件诊断:
系统板、CPU、内存、I/O板 □正常 □不正常
网卡、SCSI卡、SSA卡 □正常 □不正常
系统其他扩展卡 □正常 □不正常
硬盘、磁盘阵列 □正常 □不正常
磁带机、磁带库 □正常 □不正常
13.补丁程序是否满足稳定运行的需要 □是 □否 当前操作系统补丁版本__________
本次预防性维护发现的问题:
已经解决的问题:
下一步工作计划:
附件二
数据库系统维护作业指导
一、数据库系统日常维护内容
a) 查看数据库是否在运行,运行状态是否正常;
b) 查看存放数据的数据空间是否足够;
c) 查看相关的日志文件状态是否正常;
d) 查看数据库相关的输出日志,检查有关的备份情况和关注相关的输出信息。
二、故障处理流程和指南
一、现象:数据库的状态不对。
处理流程:
根据数据库的状态信息,判断是否是数据库没有启动,是否是在维护状态等信息进行故障处理。
二、现象:创建有关的对象时因为数据空间原因失败
处理流程:
增加数据空间的大小或数目
三、现象:数据备份失败
处理流程:
查看备份用的磁带是否需要换带,如果使用的是文件,检查文件大小是否足够大。
三、维护记录
1. 数据库的版本号:
2. 数据库的状态: □正常 □不正常
3. 数据库的数据空间的剩余率是否正常:
数据空间使用率列表:
4. 数据备份是否正常: □正常 □不正常
如果不正常,原因是:_______________________________
5. 数据库输出的日志中有无其它的出错/告警信息: □有 □无
如有,信息为:__________________________________
本次预防性维护发现的问题:
已经解决的问题:
下一步工作计划:
附件三
网络系统维护作业指导
网络设备主要包括交换机、路由器、防火墙等。对于这些网络设备,为了确保系统的正常运行,我们必须及时得掌握网络的运行状态,对其中的隐患或者是不正常一些情况必须尽快解决问题,以保障应用的正常运行、防患于未然。
一、 网络设备物理状态检查
1.通过LED来判断网络设备的好坏
网络设备各部件和操作系统运行状态是否正常。从设备面板和各模块上的状态LED灯可以判断,也可以利用CISCOVIEW监视网络设备工作状态。对CiscoSecure ACS,CHECKPOINT,CiscoWorks2000等软件的工作状态,可以通过软件本身的状态测试程序和日志文件检查。
测试方法:仔细观察各网络设备的LED, LED不同的颜色和不同的闪烁频率代表了不同的含义。通过它,我们可以非常方便地判断出网络设备硬件是否正常及运行状态是否正常。
测试结果:
二、 使用IOS命令查看端口状态
show ip int brief
查看端口状态简略列表
show interface
查看各端口的基本统计信息
show version
查看网络设备基本的软硬件信息
show environment
查看高端路由器上查看网络设备温度、电压、风扇参数是否正常
以下是一个show interfaces的例子,在实际工作中可以参照进行
Router# show interfaces
FastEthernet0/1 is up, line protocol is up
Hardware is Fast Ethernet, address is 0007.ebc3.c981 (bia 0007.ebc3.c981)
MTU 1500 bytes, BW 10000 Kbit, DLY 1000 usec,
reliability 255/255, txload 1/255, rxload 1/255
Encapsulation ARPA, loopback not set
Keepalive not set
Auto-duplex (Half), Auto Speed (10), 100BaseTX/FX
ARP type: ARPA, ARP Timeout 04:00:00
Last input 6d16h, output 00:00:00, output hang never
Last clearing of "show interface" counters never
Queueing strategy: fifo
Output queue 0/40, 0 drops; input queue 0/75, 0 drops
5 minute input rate 0 bits/sec, 0 packets/sec
5 minute output rate 20## bits/sec, 4 packets/sec
5774495 packets input, 866685887 bytes
Received 22044 broadcasts, 0 runts, 0 giants, 0 throttles
4 input errors, 2 CRC, 2 frame, 0 overrun, 1182 ignored
0 watchdog, 419 multicast
0 input packets with dribble condition detected
6071714 packets output, 487683077 bytes, 0 underruns
9097 output errors, 37162 collisions, 1 interface resets
0 babbles, 9097 late collision, 922925 deferred
0 lost carrier, 0 no carrier
0 output buffer failures, 0 output buffers swapped out
如果某个接口能够提供双向的通信,那么line protocol被标记为up,如果某个接口硬件是可用的,那么这个接口将会被标记为up。另外还可以查看input errors和output errors的数目、collsions的次数、接口重启的次数。这些都是衡量网络性能的重要参数。将显示不正常数据的端口填入下表
测试结果表
三、 查看路由表show ip route
使用show ip route命令来查看路由信息是否正确传送过来
测试结果表
四、 查看CPU、MEM利用率
通过show process cpu,show process mem来查看网络设备的资源利用率。
测试结果:
五、 使用网络管理软件Ciscoworks2000
Ciscoworks2000可能让我们在一台网管终端上方便的管理整个网络,各种直观的图形化界面让我们能清楚的看到网络中存在的问题。
重要组件功能表
前面几项维护工作都可以借助强大的网络管理工具Ciscoworks2000来协助进行,可大大减少工作量。