服务器运维管理手册

发布 2019-05-31 21:42:20 阅读 9904

***x****。

***x****。

运维服务部。

一、 文档简介 2

二、 文档目的 3

三、 文档范围 3

四、 事件处理流程 3

五、 具体操作说明 4

1) 服务器硬件管理 4

2) 服务器系统管理 9

1. windows系统管理 9

2. linux系统管理 9

六、 相关文档 10

本文档根据桑菲消费通信服务器硬件设备与系统应用管理需求,针对日常维护内容进行技术归类于总结,描述具体操作步骤与操作方法,积累服务器事件处理能力,使之服务运维能力更为主动可控。

标准服务器故障处理方法指引,服务器管理知识库积累。

服务器硬件故障判断与标准处理操作。

服务器系统日常性能检测与标准检测。

1. 检查与故障判断:

服务器硬件的主动检查方式主要分三种:

设备面板指示灯检查。

硬件系统日志检查。

第三方工具检查。

一) 面板指示灯检查。

ibm服务器上面有,电源指示灯,硬盘/ide设备活动指示灯,网卡指示灯,系统过热报警灯。硬盘槽还有硬盘指示灯。hp服务器上面指示灯一般为uid,内部和外部健康灯,其他就是电源网口灯了,dell的机种有的上面有风扇,内存,cpu,指示灯情况,图标都是很直观的,其它服务器与ibm,hp的差不多。

图示说明。详细描述:

二) 系统日志检查。

三) 第三方检测工具检查。

相关**:进入诊断网页,在第一选项卡survey中,上部有2个下拉项,左侧选择advanced,右侧选择all,会显示出更多硬件信息,点击右下的s**e按钮保存。

此界面可以看到服务器所有硬件信息。

2. 硬件设备变更操作标准:

判断并确定最快恢复时间。

判断是否有做冗余设置。

判断是否需要关机操作。

磁盘设备检测并确定阵列信息,确定有做数据备份。

是否对其它关联应用有影响。

制定回退方案,保证数据与应用的可用性。

设备变更操作。

设备兼容性测试。

应用系统运行测试。

设备变更后正式应用。

3. 相关巡检记录单:

备注:《服务器信息列表》 《服务器指示灯巡检表》

服务器系统管理主要分为:

windows系统管理。

linux系统管理。

1.1. 磁盘空间使用。

计算机管理——磁盘管理。

磁盘空间使用率是否已经到达80%

1.2. 进程监控。

任务管理器——进程。

查看进程的cpu使用率和内存使用率是否超阀值。

1.3. cpu性能。

任务管理器——性能。

查看cpu最高峰值与一般使用率是否超阀值。

1.4. 内存性能。

任务管理器——性能。

查看内存最高峰值与一般使用率是否超阀值。

1.5. 网络查看。

任务管理器——联网。

检查是否能正常访问站点页面。

1.6. 日志。

记录错误报警信息

—应用程序日志。

由应用程序或者系统程序记录的事件。

—安全性日志。

查看有效和无效的登录尝试事件,以及资源使用相关的事件。

—系统日志。

windows系统组件记录的事件。

2.1. 平均负载(uptime)

描述:uptime命令过去只显示系统运行多久。现在,可以显示系统运行多久、当前有多少的用户登录、在过去的1,5,15分钟里平均负载时多少。

2.2. 磁盘空间使用率(df -h)

描述:filesystem 文件系统 size 文件系统容量 used文件系统已经使用的容量 use%文件系统使用百分比 mounted on挂载的目录。

2.3. 进程监控(ps –ef | grep j**a)

查看应用程序启动进程数是否正常。

2.4. 内存监控(free -m)

描述:total:总计物理内存的大小 used:已使用多大 free:可用有多少。

shared:多个进程共享的内存总额 buffers/cached:磁盘缓存的大小。

第三行(-/buffers/cached):

used:已使用多大。free:可用有多少。

2.5. cpu占用率(top)

描述:top提供一个当前运行系统实时动态的视图,也就是正在运行进程。在默认情况下, cpu使用率最高的任务排在第一行,并每5秒钟刷新一次。

2.6. i/o监控(vmstat 2 10)

process:

r: 等待runtime的进程数b: 在不可打断的休眠状态下的进程数。

memory:

swpd: 虚拟内存使用量(kb) –free: 闲置内存使用量(kb)

buff: 被当做buffer使用的内存量(kb)

swap: si: swap到磁盘的内存量(kbps) –so: 从磁盘swap出去的内存量(kbps)

io: bi: 每秒读取的块数 (blocks/sbo: 每秒写入的块数 (blocks/s)

系统:in: 每秒中断数,包括时钟中断 cs: 每秒上下文切换数。

cpu(以百分比表示):

us: 用户进程执行时间(user time) sy: 系统进程执行时间(system time)

id: 空闲时间(包括io等待时间) wa: 等待io时间。

2.7. 日志系统。

—系统日志(cat /var/log/messages | grep ‘jul 23’ |grep error)

记录报警信息。

—硬件启动日志(dmesg | grep error)

记录系统启动错误信息。

—应用系统日志。

服务器各个应用的日志系统,比如:

var/log/httpd/error_log等等。

备注:《系统主机信息表》《系统主机巡检表》《系统事件记录表》

系统主机信息表》

系统主机巡检表》

系统事件记录表》

服务器指示灯巡检表》

服务器信息列表》

idc环境管理制度》

服务器搭建试验

实验任务任务有两个 一 个人利用虚拟机将iis dhcp dns服务器综合利用起来1 实验环境 启合两台虚拟机,要求每台虚拟机各有一块网卡,网卡的连接方式均为自定义。以一台win2003为服务器。服务器的ip在址设为c类ip地址。2 安装iis dhcp dns服务。3 设置dns服务器,新建一个区...

服务器故障应急预案

一 服务器软件系统故障应急预案。1.发生服务器软件系统故障后,立即启动备份服务器系统,由备份服务器接管业务应用。2.相关责任人将故障服务器脱离网络,保存系统状态不变,取出系统镜像备份磁盘,保持原始数据。3.信息网络事件应急领导小组在确认安全的情况下,重新启动故障服务器系统 重启系统成功,则检查数据丢...

web服务器工作原理

顾客关系又称消费关系,是商品经济社会中最重要的关系。狭义上的顾客仅仅是指市场上生活资料的消费者,这当然很重要,但是,公关的讨论涉及整个社会的文化特征,这就将顾客的涵义扩大了,它不仅包含了生活资料的消费者,也包括生产资料的购买者和使用者,进一步还包括精神产品,如思想产品 科研成果等的购买者和消费者。我...