您的当前位置:首页正文

基于浪潮天梭K1系统的HA高可用解决方案V1.3

2021-07-31 来源:好走旅游网


基于浪潮天梭K1系统的

高可用解决方案

浪潮集团 2013.07

目录

1.方案背景 ................................................................................. 1

1.1背景分析 .............................................................................................................. 1 1.2基于浪潮天梭K1系统的高可用解决方案 ........................................................ 2 1.3解决方案拓扑图 .................................................................................................. 3 1.4推荐配置 ............................................................................... 错误!未定义书签。

2.方案功能特色 ......................................................................... 5

2.1可靠性 .................................................................................................................. 5 2.2可扩展性 .............................................................................................................. 7 2.3易管理 .................................................................................................................. 8

3.客户价值 ................................................................................. 8 4.成功案例 ................................................................................. 9

4.1中国建设银行 ...................................................................................................... 9 4.3中国进出口银行 ................................................................................................ 11

5.浪潮天梭K1系统简介 ......................................................... 12

1.方案背景

1.1背景分析

全球经济一体化的今天,企业的管理和运营已经离不开信息系统的支撑,因此企业信息系统的业务连续也成为决定企业生死存亡的重要因素之一。如果一些关键应用一旦发生服务器宕机或应用故障,将给企业带来巨大的经济损失,并且由于业务的不可用而影响到企业的信誉,致使客户对企业失去信任,所造成的危害是致命的。可见,对那些需要保障信息安全和提供不间断的信息服务的企业而言,业务系统的容错性和不间断性显得尤为重要。因此,在保障各种关键应用持续运营,甚至达到永续经营并实现业务的良性循环方面,高可用集群管理软件的巨大作用得到了广泛认可。

一个牢固稳定的数据库系统对业务的连续性显得尤为重要。Ontrack(国际权威的数据恢复机构)的调查数据表明,造成数据库数据丢失的原因排在第一位的是硬件故障,其他依次为人为错误、软件损坏、计算机病毒和自然灾害。

图1

数据表明,硬件故障是数据库最大的威胁,其次是人为错误和软件损坏。这个比例占到90%,但这三方面的风险都可以通过前期的硬件选型,软件选型和人员培训来减小。

所以一个健壮的信息系统的必然条件: ➢ 高可靠和高性能的硬件; ➢ 易操作和高可用的软件。

1.2基于浪潮天梭K1系统的高可用解决方案

浪潮在业务连续性方面已经积累了多年的销售经验和研发经验,具有很大的客户保有量和丰富的销售经验,同时在这个过程中不断创新、不断挑战积累了很多的研发心得,结合浪潮多年理解的客户需求,开发了“浪潮K-HA高可用集群软件”,在保障信息系统的业务连续性方面走在了前列。在浪潮K-HA高可用集群软件中,能满足客户多点业务连续保护需求。

针对目前情况浪潮推出了基于浪潮天梭K1系统的业务连续性解决方案,主要面向重负载的高端数据库应用市场和对可靠性要求高的核心应用系统,定位于大型数据库应用和安全性可靠性要求高的应用领域,包括数据仓库应用、联机事务处理、联机事务分析等,为高性能、高可用需求的用户提供一个解决方案。

1.3解决方案拓扑图

浪潮K-HA高可用集群软件的典型拓扑简介:

1.多节点共享存储方案:

 多节点共享磁盘阵列,最多可支持8节点,保障客户投资不过时;

 随发展业务按需添加节点,充分满足客户业务发展需要,保护客户投资的有效性;  支持IP-SAN,FC-SAN存储,灵活的部署环境;

 多活跃模式,多节点可同时进行工作,充分利用资源,实现硬件资源的最大化利用;

浪潮K-HA高可用集群软件的典型集群管理拓扑结构简介:

集群ALAN管理控制台一管理控制台二集群BLAN……服务单元服务单元服务单元服务单元服务单元服务单元服务单元 1.集中式管理方案:  管理控制台和被管理集群(可以是多个集群或单一集群)相分离的大环境部署;

 减少服务器资源消耗,对于大规模部署有较大的便利性;  支持多个集群统一管理,满足不同客户的部署需求;

集群LAN管理控制台服务单元管理控制台服务单元管理控制台服务单元…… 2.分布式管理方案  管理控制台和被管理集群相契合,每个管理节点上都存在一个管理控制台;  有效降低成本,可从集群中任何一个节点获取集群信息并对集群进行操作;

2.方案功能特色

2.1可靠性

硬件可靠性

硬件故障造成数据系统数据丢失的的比例为44%,是所有原因中比例最大的。相应的数据库方案中硬件的可靠性应该作为方案中最重要的部分考虑。

浪潮依托国家“十一五”863计划“高端容错计算机”重大专项成功研发出我国第一台小型机浪潮天梭K1系统,标志着我国高端服务器一直被国外垄断的现状即将被打破,从而实现金融、电信、能源、交通等命脉行业的核心信息化建设重大装备的自主可控。

浪潮天梭K1系统实现了芯片/模块、系统管理、操作系统、业务应用的多方面的冗余容错设计,可用性可达99.9994%,tpmc可达600万,能够胜任关键行业的核心应用。

硬件层面,天梭K1系统的电源模块、高速交换模块、计算模块、散热模块、管理模块、IO模块均采用了冗余设计,每个模块均支持热插拔替换,可保证系统的不停机维护。

软件层面,浪潮天梭K1采用K-UX操作系统,通过内核副本、驱动程序保护框架、进程冗余、应用容器等功能,保证操作系统与上层应用的稳定运行。同时通过高可用集群管理软件,消除了单节点时意外宕机的危险。

机柜设计层面,浪潮天梭K1系统可将小型机、操作系统、数据库、双机方

案整合于一体,成为完整的信息化系统。全部设备、应用均可部署于浪潮天梭K1系统之中,大幅降低实施、应用、管理难度。同时独特的安全锁设计,可将数据库系统完全隔离起来,防止非法维护人员对系统的破坏。

软件可靠性

浪潮K-HA高可用集群软件提供了多种资源的监控,包括对共享存储可访问性,数据库可访问性,网络环境,以与应用程序的服务和进程等进行实时监控。此外,为了时刻确保系统的完整有效,浪潮K-HA高可用集群软件同时也对待机服务器的状态进行监控。通过全方位的故障监视,浪潮K-HA高可用集群软件可以实时地掌握整个系统的软硬件资源的状态,这样,在系统发生故障时,就能够准确诊断,并与时进行恢复处理。

除了软硬件资源监视外,在系统中,服务器之间还需要定期的互相检查对方的健康状态,称之为心跳探测。心跳探测主要通过网络来进行。首选,是通过两

台服务器之间的私有网络连接的,我们称之为私网心跳。然后,在私网发生故障时,将公网作为备份心跳方式。

为了避免单纯网络故障导致的误切换,除了网络心跳外,浪潮K-HA高可用集群软件还额外采用Ping第三方服务器的方式来进行状态确认。

2.2可扩展性

纵向扩展

纵向扩展指的是集群中单节点的扩展能力。浪潮模块化的设计使天梭K1系统的扩展方便易操作。

浪潮天梭K1系统的扩展性主要体现在:

➢ 支持4-32颗处理器,可以根据当前业务量的需求选择处理器的颗数; ➢ 在内存方面,支持256条DIMM,根据应用选择配置数量;

➢ 有16个PCIe2.0X16插槽,32个PCIe2.0X8插槽,充分满足客户对网卡、HBA

卡、存储等外围设备的扩展需求; ➢ 最大支持12块SAS/SSD硬盘。

横向扩展

当单节点的纵向扩展不能满足用户日益增长的应用需求的时候,这就需要进行横向扩展,即通过集群软件建立集群实现性能的提升。

软件扩展性和兼容性:

➢ 最多支持8节点,具备良好的系统扩展性

➢ 支持多活模式,多服务器之间进行互备,保证用户资源利用率。 扩展灵活主要有以下4种扩展方式

浪潮K-HA高可用集群软件的多种灵活的扩展方式决定了浪潮K-HA高可用集群方案具有更广泛的应用场合。

2.3易管理

浪潮K-HA高可用集群软件:

➢ 中文界面,依照国人习惯 ➢ 支持远程管理 ➢ 支持故障通知服务

3.客户价值

1.为客户提供多种业务模式,满足客户的各种应用模式

➢ 共享型:多节点共享磁盘阵列,最多可支持8节点 2.为客户提供多种集群管理模式,满足客户的各种部署模式

➢ 集中式管理型:减少服务器资源消耗,对于大规模部署有较大的便利性 ➢ 分布式管理型:有效降低成本,便于从任何一个节点获取集群信息并对

集群进行操作

多种高可用模式可以充分适应客户的实际应用,拓宽了浪潮HA的应用场合。 3.系统高可靠、高可用,保证用户业务不间断

硬件的高性能和高可靠性,以与浪潮高可用集群管理软件的多活模式,从硬件和软件两个方面保证了整个系统的可靠性和性能。

4.人性化设计:

➢ 中文界面,依照国人习惯 ➢ 支持远程管理 ➢ 支持故障通知服务

5.管理方便易操作--浪潮高可用系统优秀的管理性

➢ 提供故障与时率:从以前用户反馈问题到现在的主动预警,大大提高了故障得知的与时率。

➢ 降低故障发现率:采用监控系统后,故障率大大下降,一般问题都在故障发现前发现并解决。

➢ 提升故障解决率:从原先的出现问题找故障,到监控系统自动告知故障点,大大缩短了故障的排查解决时间。

➢ 为IT系统瓶颈升级提供依据:有效对整体IT应用系统进行监控,运维人员可发现系统基础设备的健康状态信息,图表式的展示,可协助迅速定位系统应用瓶颈,对IT系统升级有针对性。

➢ 直观可视的大屏展示:为参观视察人员展示IT系统状态,图表、自主编辑的拓扑展示等,可使参观视察人员直观明了的看到IT应用与基础设备等的应用状态,可为参观人员,视察领导留下深刻印象。

4.成功案例

4.1中国建设银行

——分行级核心业务应用,创新采用异构平台互备运行方案

项目概况

2010年8月浪潮天梭K1主机在建设银行XX区分行中间业务系统成功上线并稳定运行至今,是国产关键应用主机在省级分行核心业务系统中的典型应用案例。为保障系统平稳运行与充分利用客户原有设备投资,最终移植上线时采用分批上线,并在国内首创采用异构平台互备运行的整体解决方案。该方案既提升了业务的处理性能,同时也保证了系统具有极高的可靠性,建立起了国产关键应用主机进入核心应用的有效途径。

异构平台双机互备运行架构

建行银行中间业务系统采用1套浪潮天梭K1系统运行,并使用1套IBM小型机作为备机。系统采用Informix数据库,Tuxedo中间件,Patrol监控管理软件。

应用架构

中间业务系统,与银行的柜台系统、存贷款系统等统称为银行的核心业务系统(即生产性业务系统)。该类业务覆盖X围广,交易量增长迅速,更是成为了现代银行业,特别是省级分行中最重要的运行系统之一。

建行XX区分行区域业务综合处理平台,现为全XX14个二级分行、近200个营业网点、3300多个柜员、2万多台自助和电子设备提供着系统服务,覆盖了营业网点、自助设备、电子渠道等银行主要的交易和客户服务渠道,日均交易量近30万笔。 用户赠言

建设银行XX区分行信息科技部总经理朱鹏鹏参与项目上线与运维全过程,评价表示:“天梭K1系统上线至今,一直运行正常。期间没有出现过任何导致系统中断、停止服务的故障,性能与稳定性完全满足业务应用需求,一点儿也不亚于原来使用的国外品牌关键应用主机。浪潮推行专业化的现场服务,为系统运行提供了很好的技术支持保障。同时运营维护成本大大降低,更为业务的扩展提供了发展空间。非常高兴选择使用了天梭K1系统,我们对国产关键应用主机的发展更加充满了信心。”

4.3中国进出口银行

——关键应用的软硬件系统平台,全面国产化产品实践

项目概况

中国进出口银行是直属国务院领导、政府全资拥有的国家银行,网上银行业务系统是其重要的业务系统之一,系统安全要求属银监会三级系统,非计划停机时间要求十分严格。此前,国外关键应用主机在该领域拥有绝对的优势地位,其中间件与应用系统也都是由国外厂商产品承担。

系统架构

项目采用2套浪潮天梭K1系统,承担起中国进出口银行的网上银行系统核心数据库、行为监控分析等应用。系统采用8路配置,单台32颗计算核心,128G内存。业务系统采用全国产解决方案:浪潮天梭K1系统,浪潮K-UX操作系统,人大金仓数据库,东方通中间件。

应用架构

中国进出口银行网银系统主要由三层构成:网银应用、网银基础构建、基础应用架构。

该项目的成功实施标志着是我国银行业首次在关键应用的软硬件系统平台全面采用全国产产品,迈出了我国金融领域核心信息系统国产化与信息安全自主可控的坚实一步。

5.浪潮天梭K1系统简介

中国首款自主研发的关键应用主机系统 浪潮依托国家“十一五”863计划“高端容错计算机”重大专项成功研发出我国第一台32路关键应用主机浪潮天梭K1系统,标志着我国高端服务器

一直被国外垄断的现状即将被打破,从而实现金融、电信、能源、交通等命脉行业的核心信息化建设重大装备的自主可控。

浪潮天梭K1系统是一款基于领先的CC-NUMA架构、稳定可靠、高性能的产品,凭借独特的体系结构、监控系统、散热系统、热插拔冗余设计与容错操作系统完美展现了极高的性能、可靠性、可扩展性、灵活性、可用性、安全性和可管理性。

 自主突破打破垄断服务国家

浪潮天梭K1系统在体系结构、系统总线协议设计、核心芯片组设计、硬件设计、结构和散热设计、系统BIOS设计、容错操作系统核心以与应用系统开发和移植等关键技术方面实现一系列突破,即将打破在金融、电信等核心经济领域所用高端服务器由国外品牌垄断局面,在保障国家信息安全的同时,还将大幅降低中国信息化成本。  性能领先动力澎湃

浪潮天梭K1系统采用英特尔安腾93/95系列处理器,主频在,L3 Cache 10-32MB,最大支持32颗处理器,256个物理核心,4096GB内存;系统峰值浮点计算能力2560GFLOPS,提供澎湃计算性能,满足最苛刻系统需求。在处理器性能与数量、计算峰值性能、存储器访问带宽、存储器容量、互连通信能力、I/O访问带宽与I/O扩展能力等多项关键指标均已达到或超过国际高端服务器的现有领先水平。  创新架构领先全球

浪潮天梭K1系统基于全球领先的CC-NUMA体系结构,独创的双翼可扩展紧耦合大型服务器体系架构,互连通信子系统采用全互连,使用多套平行网络,I/O子系统采用分布共享并行I/O结构。  高级容错稳定可靠

浪潮天梭K1系统的容错设计整体上与国际顶级产品相当,系统具有软硬件结合的多级容错机制与高可用技术,在芯片、模块和系统软件多个层面进行冗余和高可靠设计。系统可用度达到并超过了99.9994%,系统年停机时间小于等于3.16分钟。

 自研系统安全可信

浪潮独立自主地研发出操作系统,符合LSB和POSIX标准,兼容主流的数据库和中间件。同时针对CC-NUMA体系结构和MP处理器,对系统核心进行优化,提

供高可靠和高性能的存储管理和进程管理。在高可用方面,提供故障管理子系统、驱动保护框架、高效和精简的虚拟机监控器、实现故障隔离的应用容器、硬件动态分区,支持操作系统核心的动态重构,支持进程迁移,支持关键硬件部件的冗余和热插拔。

技术规格 产品型号 处理器 内存 体系结构 硬件分区 浪潮天梭K1系统 支持32颗英特尔四/八核心双线程安腾93/95系列处理器 最大4096GB (256条 DDR3 RDIMMs) 紧耦合CC-NUMA架构 最大支持8个硬件分区 48条PCI-E 插槽(2个16X PCIE Slots, 4个8X PCIE Slots per I/O扩展性 clump) 系统互联 XX面容错高速互联,总带宽1088GB/s 存储 外置IP或FCSAN存储 电源 三相交流输入, 系统额定功耗 20 KW 操作系统 自研操作系统 1. 内存镜像与热备 2. MCA 故障处理器功能 3. 动态重配功能 高级特性 4. 模块热插拔 5. 操作系统CC-NUMA优化 6. 与系统状态无关的带外监控管理功能 7. 模块冗余容错: 电源、风扇、互联模块等 IO带宽 512GB/s 浮点运算 2560GFLOPS 内存带宽 1177.6GB/s 系统可用性 >99.9994% 每年宕机时间 ≤3.16 minutes 系统可维护性 支持在线检测与诊断 系统可服务性 采用模块化设计,支持热插拔功能

因篇幅问题不能全部显示,请点此查看更多更全内容