巡检报告单
机器型号:
序列号:
检查时间:_______年____月____日
1.机房环境:
温度 □符合要求 □不符合? 湿度 □符合要求 □不符合
2机器清洁(根据需要清洁机器各部件): □已清洁 □不需要
3.检查系统硬件情况:
设备故障灯是否有亮 □有 □无 是否有其他否异常情况(如硬盘、风扇异常的声音,电缆破损)
□有 □无
4.系统错误报告(Error Log):
有否硬件故障 □有 □无 故障内容:
若有硬件,运行故障诊断分析错误报告( eg: diag -ed hdisk1)
结论(如SRN, FRU等):
有否软件故障 □有 □无 故障内容:
结论:
5.有否发给root用户的错误报告(mail): □有 □无 结论:
6.检查hacmp.out,smit.log,bootlog等: □正常 □不正常
7.文件系统的使用率不大于80%: □是 □否
8.查看卷组信息(lsvg -l vg_name),有没有"stale"状态的逻辑卷:
□是 □否 若有,用syncvg 命令修复"stale"逻辑卷。
备注:
9.系统性能,有否性能瓶颈(topas, vmstat等): □有 □无 交换区使用率是否超过70%(lsps -s),实际值____?
CPU是否繁忙(sar 1? 10),idle值_____
I/O平衡(iostat 1)?
10.备份:
有否合符要求的系统备份: □有 □无 最近一次系统备份的时间_________?
有否符合要求的用户数据备份: □有 □无 有否符合要求的用户数据备份: □有 □无 磁带机是否需要清洗: □需要 □不需?
11.通信:
网卡的状态、IP地址、路由表等: □正常 网卡通信(ping): □正常 /etc/hosts文件或DNS设置: □正常
12.系统DUMP设置是否正确: □正常
13. HACMP 测试:
Cluster Verification: □正常 相关参数设置检查: □正常 (根据需要)接管测试: □正常
14.系统硬件诊断:
系统板、CPU、内存、I/O板: □正常 网卡、SCSI卡、SSA卡: □正常 系统其他扩展卡: ? □正常 硬盘、磁盘阵列: ? □正常 磁带机、磁带库: ? □正常
15.查系统参数是否正确: □是 I/O pacing: High Water Mark/Low Water? Mark:33/24 Syncd:10?
Aio :available? /etc/environment文件中TZ不应有夏时制 Hacmp 系统中Power Monitor子系统应关闭?
16.补丁程序(PTF)检查,现有补丁维护版本为_____: 根据系统运行状况决定是否安装新的PTF。 需要安装的补丁程序:
17.运行#snap –ac,生成文件命名为snap+s/n.pax.Z。
18.检查errdemon, srcmstr是否正常运行: □是 □不正常? □不正常 □不正常 □不正常 ? □不正常; □不正常? □不正常 □不正常 □不正常 □不正常 □不正常 □不正常 □否 □否
第二篇:第二次服务器HIS巡检报告
Windows 系统巡检报告
一、 服务器巡检的重要性
windows服务器是系统重要的业务运行平台,对服务器进行巡检能够及时发现服务器的隐患,以便于改善和优化服务器的性能;观察服务器的运行状况,及时对设备进行调整,保证服务器的24小时不间断的工作;以及采集网内服务器信息。
二、日常巡检内容包括以下方面:
1、 服务器物理硬件巡检
2、 机房环境巡巡检
3、 操作系统的磁盘、内存、cpu情况使用情况
4、 服务器系统日志
5、 运行与服务器上应用是否可用
6、 应用系统日志检查(根据实际情况执行)
7、 杀毒软件的检查(查看360系统是否安装)
8、 系统定时任务执行情况
三、巡检内容详细说明 1、服务器硬件巡检主要内容
2、操作系统检查
3、性能检查
(1)内存、cpu使用情况巡检 用命令taskmgr.exe打开任务管理器
检查方法:
Windows下使用任务管理器,记录占用内存、cpu最多的前五位进程或应用程序; 性能
CPU使用情况:表明处理器工作时间百分比的图表,该计数器是处理器活动的主要指示器,查看该图表可以知道当前使用的处理时间是多少。
CPU使用记录:显示处理器的使用程序随时间的变化情况的图表,图表中显示的采样情况取决于“查看”菜单中所选择的“更新速度”设置值,“高”表示每秒2次,“正常”表示每两秒1次,“低”表示每四秒1次,“暂停”表示不自动更新。
PF使用情况:正被系统使用的页面文件的量。
页面文件使用记录:显示页面文件的量随时间的变化情况的图表,图表中显示的采样情况取决于“查看”菜单中所选择的“更新速度”设置值。
总数:显示计算机上正在运行的句柄、线程、进程的总数。
认可用量:分配给程序和操作系统的内存,由于虚拟内存的存在,“峰值”可以超过最大物理内存,“总数”值则与“页面文件使用记录”图表中显示的值相同。
物理内存:计算机上安装的总物理内存,也称RAM,“可用”表示可供使用的内存容量,“系统缓存”显示当前用于映射打开文件的页面的物理内存。
内核内存:操作系统内核和设备驱动程序所使用的内存,“页面”是可以复制到页面文件中的内存,由此可以释放物理内存;“非分页”是保留在物理内存中的内存,不会被复制到页面文件中。
(2)硬盘使用情况,
检查方法:Windows下通过查看‘我的电脑’—‘管理’—‘磁盘管理’可以查看磁盘分区与对应分区使用情况,
在日常的维护中赢做到以下几,这样才能使设备更好的运行,更方便网络管理员的日常维护。
A、要定期清理磁盘垃圾文件,选择分区‘属性’—‘常规’—‘磁盘清理’。
B、定期检查磁盘的错误信息,选择分区‘属性’—‘工具’—‘开始检查’。
C、定期整理磁盘碎片,选择分区‘属性’—‘工具’—‘开始整理’。
4、安全检查
(1) 系统信息检查,显示关于计算机及其操作系统的详细配置信息,包括操作系统配置、
安全信息、产品 ID 和硬件属性,如 RAM、磁盘空间和网卡,系统运行时间。
(2)服务器重要的系统日志检查
检查方法:
windows系统下通过事件查看器进行查看,重点记录其错误日志号即可,通过错误日志号对错误进行定位解决,打开事件查看器命令eventvwr。
A、应用程序日志,包含由应用程序或系统程序记录的事件,主要记录程序运行方面的事件,例如数据库程序可以在应用程序日志中记录文件错误,程序开发人员可以自行决定监视哪些事件。如果某个应用程序出现崩溃情况,那么我们可以从程序事件日志中找到相应的记录。
B、安全性日志,记录了诸如有效和无效的登录尝试等事件,以及与资源使用相关的事件,例如创建、打开或删除文件或其他对象,系统管理员可以指定在安全性日志中记录什么事件。
C、系统日志,包含Windows server 2003 的系统组件记录的事件,例如在启动过程中加载驱动程序或其他系统组件失败将记录在系统日志中。
(3)系统端口检查
查看开启了哪些端口,显示所有连接和监听端口。所接开启端口的服务。
在对37家卫生信息中心其中的13家进行巡检时发现了以下较为严重的问题。
1.左家庄社区的双机热备备份服务器没有开启(网管解释网络正常运行没有必要开启;现场建议:尽快开启,若主设备服务器有任何问题,从设备可及时顶上,防止业务中断带来的严重损失)
2.八里庄社区的360系统兼容出现问题;从服务器设备操作系统有问题,双机热备有可能出现问题,网管建议蒋工请尽快过去现场查看。
3.高碑店双机热备的从设备服务器内存过高,建议增加内存;
4.太阳宫社区中 如果给HIS、医保服务器双方都传数据,HIS这边有时传不上去;
5.奥运村社区服务器内存使用率过高,建议增加内存;
6.八里庄第二社区双机热备的从服务器未开启(网管解释:备份服务器一开机,LIS就无法使用;现场建议:资深工程师抽时间过去进行现场勘查);存储Storwise V3500磁盘指示灯亮黄灯,建议资深工程师前去现场查看;
7.豆各庄社区网管建议延长HIS服务器质保