xxx运维服务项目工作任务书
XXXX有限公司 2015年7月16日星期三
1
1现状描述和需求
xxx随着业务的不断拓展,生产系统越来越复杂。目前xxx已经建成若干套
系统,支付系统、办公系统、存储服务器、线下支付系统、清算系统、审批系统、加密机、堡垒机、对账平台、防病毒系统、统计分析平台、电信合约机、外网行为审计系统等。xxx系统实时性要求很高,xxx系统运营团队目前有3人,分别负责网络,服务器,数据库等一个或多个方面,随着业务量的增长和日益复杂的生产系统及基础环境,人员数量与系统运营岗强度之间的矛盾日益突出。
为解决系统运营人员数量不足的情况,拟启动IT运维外包项目,从一家技术实力雄厚的科技公司引入5名专业工程师,分别承担信用xxx运维流程体系建设、网络、主机及数据库等方面的技术支持,对xxx系统运维人员提供咨询和帮助,同时为xxx现有生产系统提供技术支持。
2服务内容描述
2。1咨询服务内容描述
服务目标:
xxx运维体系整体规划咨询并协助实施落地;合规、内控管理体系满足业务持续性及信息安全监管要求。 服务范围:
xxx运维管理体系优化. 服务内容:
依据监管部门有关规定,梳理、修订、完善xxx运维体系。 服务周期和计划:
服务周期 3个月,XXXX年XX月XX日-—XXXX年XX月XX日
2
交付物: 序号 1 2 3 4 交付物名称 《xxx机房管理操作规程》 《xxx重要信息系统突发事件应急管理操作规程》 《xxxIT服务管理操作规程》 《xxx计算机终端安全管理操作规程》 拟完成日期 5 6 7 8 9 10 《xxx系统软件版本管理操作规程》 《xxx信息安全管理操作规程》 《xxx信息系统事件管理操作规程》 《xxx计算机及相关设备管理操作规程》 《xxx软件版本管理操作规程》 《xxx数据安全管理操作规程》 … 2。2运维服务内容描述
服务目标:
保障xxx业务系统高可用及持续运行;
系统和网络日常运维工作,提升运维工作质量和响应效率; 建立IT资产管理制度;
建立xxx培训制度,持续提高xxx运维技术。 服务范围:
与xxx人员一起对xxx所属的服务器、网络设备、存储设备、操作系统、数据库、中间件、应用程序等IT资产进行维护及持续改进,保障其所支撑的业务系统持续、稳定运行,保障xxx对内、外服务的正常开展。 服务内容:
3
xxx运维体系整体规划咨询并交付相关文档、制定信息系统维护计划、信息系统日常运维监控、信息系统健康检查、日常备份与数据清理、日常及紧急变更、计划内演练、容量分析与优化、运行报告编写。 服务周期和计划:
服务周期 1年,XXXX年XX月XX日——XXXX年XX月XX日
各阶段交付物 序号 1 2 3 4 5 6 7
交付物名称 运行日志 运维周报 运维月报 运维年报 容量分析报告 风险分析报告 培训教材及培训记录表 交付频次或日期 每工作日 每周 每月 每年 每季度 每季度 每半年 3服务岗位与人员要求
数据中心运维人员岗位设置原则通常有以下两种方式:按业务区域(如网络分区、应用系统类型)设置运维岗位;按技术方向(如安全、路由交换、数据库、中间件)设置运维岗位,两种岗位设置方式各有利弊,需要根据数据xxx实际情况进行选择。通过对xxx运维现状调研结果的分析,建议xxx按如下方式配备运维人员:
运维岗位: 1、网络岗(高级)1人
负责网络生产环境运维、网络安全策略实施、应用系统上线支持、应急事件处理、网络优化方案制定及实施等日常工作.检查网络设备运行情况,及时发现
4
相关的报警信息,收集网络设备数据,分析性能问题提出优化建议;配置、调整网络设备配置参数,实现应用程序的特定要求和最佳性能; 2、网络岗(高级)1人
负责xxx日常网络运行维护,协助制定网络建设、优化建议和管理章程,及时处理网络设备使用中的各类问题,保障生产、开发、测试网络的正常工作,协助生产环境相关运维工作,构成AB角。 3、系统岗1人(高级)
负责检查系统和数据库运行情况,及时发现相关的报警信息,收集系统、数据库运行数据分析性能提出优化建议;配置、调整系统和数据库参数,保障应用程序高效运转;根据实际需要安装系统和数据库官方发布补丁程序。设计并优化数据库物理建设方案;制定数据库备份和恢复策略及工作流程与规范,针对数据库应用系统运行中出现的问题,提出解决方案;对空间数据库进行分析、设计并合理开发,实现有效管理;监督数据库的备份和恢复策略的执行,数据迁移策略制定和执行;为应用开发、系统知识等提供技术咨询服务。 4、系统岗1人(高级)
负责xxxIBM,DELL小型机,服务器系统硬件和系统平台正常运行;及时分析系统硬件,软件问题;监控xxx核心数据库、统一数据库运行情况,及时处理系统和数据库问题,给出建设性意见和建议;负责xxx集中存储硬件和配置,适时调整存储划分,根据业务和开发、测试需要合理分配存储资源,及时发现存储设备存在问题,给出合理化建议;监控xxx核心数据库性能,发现数据库引擎可能存在的隐患,及时处理数据库问题。构成系统AB角。 5、数据库岗1人(中级)
负责xxxWindows平台及SQL—SERVER2000监控,问题处理;配合xxx管理人员调整数据库监控、优化、自动作业执行、数据抽取;配合相关人员调整Oracle数据库参数,监控核心数据库、统一数据库运行;根据需要调整参数配置,优化数据库运行效率;执行数据备份和恢复策略;按照安全要求提供相关数据给业务部门并跟踪和记录数据使用情况。
运维项目经理1人,由以上运维人员兼任,职责如下:
负责xxxIT运维相关流程的规划、设计、推行、实施和持续改进;负责xxx运维
5
服务流程和服务标准执行情况跟踪;负责运维工作任务内部分派下发,对实施结果负责;负责定期提交运维情况汇总报告。
人员要求:
1、针对网络开展架构设计、结构审核工作。 2、按照业务发展提出网络结构变更,地址规划优化等建议,并提交建议报告。 网络高级工程师 3、协助完成对重大变更、重大故障等解决方案的设计和审核。 4、对网络设计方案和工程实施方案进行技术指导和审核。 1、负责完成网络系1熟悉主流网络和网络技术,CCNP以上认证统某一区域或基础(或Juniper、HW、H3C同等认证)或相当服务系统运维工作,能力水平。 完成对全网的监控2.熟悉行业业务流程和系统应用需求. 保障任务; 3。具有具有撰写技术方案文档经验. 2。 根据工作总体4。具有技术方案设计经验,参与过网络项目目标,能动地设计工的设计建设工作。 作方法和规程:制订5。学历资质要求本科以上。 完成系统运行任务6
1.熟悉主流网络厂商产品和网络技术,具有CCNP(或同等)认证或相当能力水平。 2。熟悉通信线路,通信接入设备的运维管理。 3。熟悉行业业务流程和系统应用需求。 4。具有技术规范撰写能力和制度编纂工作经验。 5.具有技术方案设计经验,主持或参与过大型网络项目的设计建设工作。 6.学历资质要求本科以上. 7.10年以上在金融行业网络系统集成相关工作经验。 8.从事网络运维工作工作年限5年以上. 网络高级级工程师 所需要的管理规定和不同使用者执行正确操作任务所需6. 5年以上在金融行业网络集成相关工作经验。 8.精通线路故障处理,具有线路维护经验。 要的指令,在工作中9.从事网络运维工作工作年限8年以上。 根据实际情况不断改进或更新这些规定和指令; 3。 及时规划和申请完成工作目标所需资源,根据工作任务,制订网络规划和方案设计; 4。 负责配置管理、变更管理和故障管理; 5。 做好各种文挡的归档工作,保证技术知识的总结积累; 1、 负责xxx主机系统的安全运行 2、 配合xxx建立健全运系统岗3人(高级) 维制度并按照制度完成相关运维工作 3、 及时处理xxx系统、
10.综合布线设计经验。 1,负责xxx关键业务主机日常软硬件维护工作; 2,按照xxx相关要求调整主机配置; 3,负责xxx系统变更操作,填写相关文档; 4,负责监控xxx系统运行状态,提出优化合理性建议 5,建立机器档案,记录每次变更调整内容,确定进程访问关系和所使用的端口。 6,硬件状态监控,配合硬件维护团队更换故障部件 7、 熟悉windows server,Linux系统,能熟练配7
数据库或存储出现的故障 4、 熟练使用系统的监控工具跟踪系统运维状态 5、 配合其他部门完成xxx信息系统上线工作 置Windows Server,Linux相关服务。 8、使用跟踪工具跟踪系统和数据库运行状态及性能状态。 9、熟悉,Dell、HP、Lenovo等主流服务器硬件特性。 10、具备错误排查能力,常见问题快速、及时处理。 11、具备3年以上WindowsServer或Linux运维经验;3年或以上Oracle管理,运维经验。 12、监控xxx系统核心数据库,整体数据库状态 13、跟踪自动作业执行结果. 14、执行备份和恢复策略 15、配合业务部门 数据要求,经授权后提供业务数据 16、了解sql—server,oracle数据库工作机制,能够发现数据库异常信息,做相关处理 8
4服务管理 4.1总体工作要求
4。1。1人员进场要求
(一) 乙方派出工程师应与乙方签订正式劳动合同并满足甲方资质中明确
的其他技能要求。
(二) 乙方工程师在甲方办公场地工作之前,乙方应针对甲方工作环境、工
作要求、规章制度等方面的要求组织内部培训。
(三) 乙方工程师在甲方办公场地工作,乙方应按甲方相关流程办理人员入
场手续,并签订保密承诺函.
4.1.2人员行为与服务要求
(一) 乙方人员应按甲方管理规定每日签到。
(二) 乙方工程师在甲方办公场地工作,须遵守甲方对工作场所的相关管理
规定和规章制定.一旦有违反甲方管理规定的,乙方有义务配合甲方进行人员的调整。
(三) 乙方应保证派驻甲方工作的人员稳定性,乙方派出工程师的人员变动
将作为对乙方服务情况的考评内容,并根据乙方服务人员的总数及变动次数,确定合理的人员变动上限,若超出上线,则需要支付一定的违约金.
(四) 自初始名单确定后,后期涉及人员名单变化的,均列入人员变动范畴。
4。1.3工作内容总体要求
(一) 乙方工程师必须服从甲方的统一协调,在甲方要求的时间内保质保量
9
完成各项工作。甲方有权裁决乙方的职责范围,乙方必须执行. (二) 乙方工程师将参与的主要工作内容如下文所列,但不仅限于下述内
容,甲方有权根据项目、安全系统、安全管控等实际工作需求,进行工作内容的调整,乙方必须配合。
4。2咨询服务工作的组织实施
咨询服务工作拟按下述步骤开展 步骤1:项目启动 步骤2:调研访谈 步骤3:运维体系明晰
里程碑:第一阶段交付——xxx运维体系报告 步骤4:xxx运维体系相关文档编写 步骤5:xxx运维体系相关文档交流 步骤6:xxx运维体系相关文档修改
里程碑:第二阶段交付——xxx运维体系相关文档 步骤7:xxx运维体系优化及持续改进
4.2。1制定信息系统维护计划
乙方须协助甲方编写信息系统的日常运维保障维护计划,包括值班监控安排、日常备份计划、数据清理计划、定期巡检计划、重要维护日系统停起计划、自行组织的演练安排等,工作开展情况,对运维保障计划做必要的修订与更新.
乙方须协助甲方编写、修订相关维护计划和文档。包括: (一) 提出维护内容,制定维护计划; (二) 编写常见问题处理手册; (三) 编写应急预案;
(四) 编写变更模板、变更审核控制点。
10
4。2。2信息系统日常运维监控
乙方须协助甲方确定系统监控内容,提出监控指标,实施日常监控,根据监控和运行情况,完善监控内容;编写运行维护手册和监控操作手册;按维护计划实施日常值班监控,做好监控内容的记录;对于值班期间发生的故障或告警等进行跟踪处理;定期完成运行报告,提出监控的优化建议.
乙方协助甲方开展系统、网络、数据库、中间件和应用系统等的监控工作,包括:
(一) (二) (三) (四)
告警接收与处理; 监控指标维护; 定期分析报警内容;
对监控指标提出优化、完善建议。
4.2。3信息系统健康检查
乙方须协助甲方开展所运维系统的健康检查、日常巡检、深度巡检,包括网络、应用、系统、数据库、中间件、相关设备等,部署健康检查脚本,调整健康检查阈值,收集整理和分析处理健康检查结果;负责特殊时点的应用运行状况健康检查,方案实施和问题处理。收集整理和分析处理健康检查结果,编写健康检查报告,提出整改建议。
乙方协助甲方开展系统、网络、数据库、中间件的健康检查工作,包括: (一) (二) (三) (四)
编写健康检查脚本; 确认分析健康检查结果; 编写健康检查分析报告; 完善健康检查指标。
4.2.4日常备份与数据清理
根据甲方现场的实际条件,乙方须协助甲方制定应用系统备份策略、数据备
11
份策略、应用系统备份策略;根据备份和归档策略实施系统备份;根据数据清理策略编写数据清理脚本,实施数据清理,检查执行结果.
4.2。5计划内演练
乙方须协助甲方编写应急处置方案、演练方案、制定演练计划;按计划实施演练;编写应急演练总结报告,对演练中出现的问题进行处理,就演练发现的问题进行分析,提出整改建议;不定期更新、修订相关文档、方案。
4。2。6容量分析与优化
乙方须协助甲方定期进行系统容量性能分析,收集应用系统交易数据、业务数据、运行数据,根据业务发展和系统资源实用情况,分析系统资源使用趋势,提交系统容量性能分析报告,提出优化改进建议。
乙方协助甲方开展性能容量分析工作,做好系统容量和资源管理。 包括: (一) (二) (三)
编写操作系统、数据库、容量数据收集脚本; 性能容量分析,完成报告并提出优化扩容建议; 提交系统资源分析报告。
4.2.7风险分析与优化
乙方须协助甲方定期进行系统风险分析,对信息系统在设计、配置、管理方面的风险定期进行分析、研究,提交风险分析报告,提出优化改进建议.
4。2。8版本升级
乙方协助甲方,结合系统运行情况和厂商建议,评估现有版本(固件版本、设备驱动、操作系统版本、数据库软件版本等);制定版本升级计划和方案;组织进行新版本的测试和验证;选择个别非关键系统进行版本试点,对版本升级后运行情况进行重点监控;按方案实施版本升级;编写版本升级总结报告。
12
4.2.9运行报告
乙方须协助甲方,按照运行管理的要求,定期完成运行周报、运行月报、年度运行报告等。
5。1运维服务工作内容
5.1.1 服务目标
运维项目组提供的运行维护服务包括,信息系统相关的主机设备、操作系统、数据库和存储设备的运行维护服务,保证用户现有的信息系统的正常运行,降低整体管理成本,提高网络信息系统的整体服务水平。同时根据日常维护的数据和记录,提供用户信息系统的整体建设规划和建议,更好的为用户的信息化发展提供有力的保障.
用户信息系统的组成主要可分为两类:硬件设备和软件系统。硬件设备包括网络设备、安全设备、主机设备、存储设备等;软件设备可分为操作系统软件、典型应用软件(如:数据库软件、中间件软件等)、业务应用软件等;用户自行开发的应用软件。
服务项目范围覆盖的信息系统资源以下方面的关键状态及参数指标:
➢ 运行状态、故障情况 ➢ 配置信息
➢ 可用性情况及健康状况性能指标
13
5.1。2 IT资产统计服务 服务内容包括:
➢ 硬件设备型号、数量、版本等信息统计记录 ➢ 软件产品型号、版本和补丁等信息统计记录 ➢ 网络结构、网络路由、网络IP地址统计记录 ➢ 综合布线系统结构图的绘制 ➢ 其它附属设备的统计记录
5。1.3 网络、安全系统运维服务
从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的运维管理。
➢ 设备基础性能检测:cpu、内存使用情况监测; ➢ 设备日志查看; ➢ 设备snmp状态;
➢ 测试ping,tracert等工具的连通性; ➢ 网络安全策略应用是否正常; ➢ Internet带宽流量的实时监测; ➢ 网络拓扑链路状态监测; ➢ 异常网络数据包流量;
➢ Dos、ddos等网络攻击情况监测; ➢ Internet线路的误码率、丢包率监测;
14
5.1。4 主机、存储系统运维服务
提供的主机、存储系统的运维服务包括:主机、存储设备的日常监控,设备的运行状态监控,故障处理,操作系统维护,补丁升级等内容。
进行监控管理的内容包括: ➢ CPU 性能管理; ➢ 内存使用情况管理; ➢ 硬盘利用情况管理; ➢ 系统进程管理; ➢ 主机性能管理;
➢ 实时监控主机电源、风扇的使用情况及主机机箱内部温度; ➢ 监控主机硬盘运行状态;
➢ 监控主机网卡、阵列卡等硬件状态; ➢ 监控主机HA运行状况; ➢ 主机系统文件系统管理;
➢ 监控存储交换机设备状态、端口状态、传输速度;
➢ 监控备份服务进程、备份情况(起止时间、是否成功、出错告警);
➢ 监控记录磁盘阵列、磁带库等存储硬件故障提示和告警,并及时解决故障问题;
➢ 对存储的性能(如高速缓存、光纤通道等)进行监控。 5。1.5 数据库系统运维服务
提供的数据库运行维护服务是包括主动数据库性能管理,数据库
15
的主动性能管理对系统运维非常重要。通过主动式性能管理可了解数据库的日常运行状态,识别数据库的性能问题发生在什么地方,有针对性地进行性能优化。同时,密切注意数据库系统的变化,主动地预防可能发生的问题.
进行监控管理的内容包括:
➢ 数据库基本信息:文件系统、碎片、死锁、CPU占用率较大或时间较长的SQL语句。 ➢ 表空间使用信息监测; ➢ 数据库文件I/0读写情况; ➢ Session连接数量监控; ➢ 数据库监听运行状态监测;
➢ 查看每日数据备份、数据同步是否正常; ➢ 报警日志监测;
➢ 对表和索引进行Analyze,检查表空间碎片; ➢ 检测数据库后台进程;
➢ 数据库对象的空间扩展情况监测;
5。1.6 终端、外设运维服务
负责对终端PC、笔记本以及工作站的操作系统、应用软件和硬件的维护,解决使用人员在应用过程中遇到的问题并进行简单培训,完成打印机等其他外设的故障处理工作.
16
6.1服务流程管理
事件处理
乙方须协助机房对来自系统监控的事件进行响应并处理。对接到的电话、短信通知或事件处理单,及时做出响应,完成事件的处理;在事件处理完毕后,及时整理、完成事件分析报告;定期回顾历史事件,分析潜在风险,提出优化建议.
乙方协助甲方对事件和问题进行响应并处理。具体工作如下: (一) (二) (三) (四) (五)
负责编写应急场景收集脚本并部署; 负责事件和问题的诊断及处理; 负责制定应急预案; 负责应急处理;
负责事件和问题分析,负责提交报告、完善应急预案或提交知识.
问题处理
乙方须协助甲方对事件处理中未找到原因的事件进行分析处理流程,结合系统日志、事件现象等数据,对问题做分析处理,力求找出问题原因,形成解决方案。
变更与上线
乙方协助甲方对涉及系统变更的需求(外部需求、扩容需求、上线需求等)进行分析,完成需求分析报告;与基础设施资源管理部室落实变更所需资源,确认涉及到的资源到位;编写变更、系统上线方案、回退方案及其他上线资料;核实或确定上线版本;填写变更申请单,提出变更申请;参加变更、上线实施工作.
知识管理
乙方协助甲方对已处理的事件、问题等进行总结,形成知识点,提交甲方人
17
员审核后,归入中心知识库。
风险管理
乙方应遵守关于系统安全性管理、设备口令管理、数据安全性管理、人员进出机房管理等相关管理规定.协助甲方定期开展系统安全性检查,以满足风险管理相关规定与要求。
服务响应
乙方协助甲方对客户的服务请求做出响应、满足或支持客户服务请求,提供技术支持。
18
因篇幅问题不能全部显示,请点此查看更多更全内容