中小銀行私有云建設實踐研究
時間:2022-03-19 03:45:15
導語:中小銀行私有云建設實踐研究一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
摘要:本文總結(jié)了中小銀行私有云需求及建設經(jīng)驗,并對未來發(fā)展方向進行試驗性探索。一是通過虛擬化建設,解決資源利用率低、空間能耗大、資源成孤島、資源提供慢、運維人員“救火式”工作、操作風險大等問題;二是通過云管理平臺及自動化運維平臺建設,實現(xiàn)IT資源的自動化、服務化、自服務的“云”管理,將企業(yè)管理理念、流程落地到平臺中,降低操作性及合規(guī)風險;三是對私有云帶來的能耗及空間占用的減少、資源及風險管理的趨嚴、高可用性及容災建設的提高、開發(fā)運維關系的變化進行分析;四是在新技術新理念的支撐下,提出私有云未來應向業(yè)務能力服務化的服務云平臺建設轉(zhuǎn)變,融合多種技術進一步支撐、引領業(yè)務發(fā)展。
關鍵詞:虛擬化;私有云;云管理平臺;自動化運維平臺
當前,云計算相關技術已經(jīng)成熟,成為各行各業(yè)IT建設的主流。本文對中小銀行多年的私有云建設經(jīng)驗進行總結(jié),并分享筆者對新方向、新課題的探索。
一、挑戰(zhàn)與機遇
近年來,隨著農(nóng)信規(guī)模不斷擴大、業(yè)務不斷增長,應用系統(tǒng)及設備的數(shù)量不斷增加、數(shù)據(jù)中心能耗增加,IT建設面臨種種挑戰(zhàn)。一是煙囪式的建設造成設備眾多、資源利用率低。二是設備占用空間大,用電、制冷等能耗高,無法做到綠色節(jié)能。三是IT資源形成孤島,在業(yè)務高峰期,資源無法靈活調(diào)配。四是資源從規(guī)劃到上線,需要3-6個月以上,影響了新業(yè)務開發(fā)進度。五是高可用性、災備架構(gòu)不適應新的需求,建設及改造難度大。六是運維壓力大,存在大量“救火式”的重復勞動,運維人員無法提升自我和系統(tǒng)架構(gòu),造成了操作性風險大、多部門溝通協(xié)作困難等問題。七是各縣域法人行社有大量的特色業(yè)務,其效率、安全性、隔離性、資源彈性要求較高,無法有效支撐。這些問題造成了運維成本高,阻礙了業(yè)務的進一步發(fā)展。IT運維部門迫切需要改革,實現(xiàn)從成本中心向價值中心的轉(zhuǎn)變。
二、私有云基礎架構(gòu)
虛擬化將物理設備虛擬成虛擬設備,并整合成資源池,分享給使用者。從使用者角度看,這些虛擬設備和物理設備是沒有區(qū)別的,實現(xiàn)了IT資源的動態(tài)分配、靈活調(diào)度、跨域共享,提高資源利用率。采用虛擬服務器代替物理服務器無須調(diào)整應用架構(gòu),是運維部門在難以獲得其他部門支持時,可獨立實施、平滑過渡的方案。實現(xiàn)IT資源的資源池化,應從數(shù)據(jù)中心全局角度考慮IT基礎軟硬件的高可用性架構(gòu)。一是需要從整體考慮資源隔離,虛擬資源池應分布于防水、防火、供電、制冷系統(tǒng)相隔離、具有高可用性的不同機房。二是網(wǎng)絡、計算、存儲資源充分冗余,計算資源池還應設計30%冗余,滿足虛機故障遷移需求。三是用傳統(tǒng)高可用性技術在故障發(fā)生后恢復應用對外服務,實現(xiàn)應用高可用性,虛擬化技術用于故障發(fā)生后遷移故障虛機,恢復應用高可用性。要實現(xiàn)應用系統(tǒng)從物理機到虛擬資源池的平滑、安全、快速遷移。一方面,要利用虛擬化平臺提供的P2V工具,實現(xiàn)物理機到虛擬機的遷移;另一方面,為減少系統(tǒng)停機時間,應結(jié)合應用高可用架構(gòu),進行應用拆半遷移(集群設備逐一停機遷移到虛機),其中采用主備架構(gòu)應用需要一次不到半個小時的停機窗口,多活集群會造成部分連接中斷或延時響應,但不會造成停機。
三、云管理平臺及自動化運維平臺建設
云計算是將IT資源作為一種服務,通過網(wǎng)絡,隨時、隨地、不限設備、不限方式、不限渠道地按需供給用戶的模式。因此,私有云需在虛擬化基礎上,通過云管理平臺(以下簡稱“云管”)及自動化運維平臺建設,落地企業(yè)管理理念和云理念。(一)云管理平臺建設。云管至少應包含用戶管理、資源管理、服務交付及管理、容量及成本管理、運維功能及外部系統(tǒng)集成等模塊,并應具有跨地域多數(shù)據(jù)中心統(tǒng)一管理能力。1.虛擬化資源的共享特性造成了隔離性、安全性、合規(guī)性的問題,因此在傳統(tǒng)用戶管理外,需增加租戶管理模塊。一是采用多租戶技術,遵循一定的規(guī)范,實現(xiàn)租戶間資源、數(shù)據(jù)、接口的隔離,租戶內(nèi)共享資源、數(shù)據(jù)、接口,并使用統(tǒng)一的服務等級(SLA)、資源等級(RLA)管理。二是設置租戶管理員,采用配額管理的方式,在配額內(nèi),租戶管理員可以自行分配、管理資源,實現(xiàn)用戶管理的自服務,進一步降低運維壓力。2.資源管理是云管對接虛擬化工具提供的接口,實現(xiàn)對網(wǎng)絡、存儲、計算、安全、負載等資源進行統(tǒng)一自動化的配置、分配、監(jiān)控、計量、存量納管等功能,以實現(xiàn)云管的其他模塊對資源的交付、展示、管理等。3.服務交付及管理要實現(xiàn)資源按需、定制化、自服務式交付。一是通過資源管理模塊實現(xiàn)單一資源的用戶定制、自動化生成并交付。二是對多種資源進行服務編排,將多種資源按用戶需求有機整合、共同交付。三是將經(jīng)常使用的服務編排做成應用藍圖。四是將單資源、服務編排、應用藍圖等做成服務目錄,在用戶門戶上,用戶可以通過服務目錄的“菜單”去“點菜”,實現(xiàn)資源獲取的自服務。五是提供SLA,RLA管理、服務期限配置、日志留存、命名規(guī)范等合規(guī)管理及服務報告等功能。4.容量與成本管理是運維走向運營的重要一步,通過對資源使用情況及趨勢進行分析,跟蹤、分析、預測容量使用情況,提供容量管理功能,為資源池化管理提供支撐;通過對資源使用進行計量計費,實現(xiàn)對項目及產(chǎn)品的成本控制及收支計量等管理。5.運維提供了工單、流程、監(jiān)控、配置、容量、報表、日志等管理功能,并提供報表統(tǒng)計、大屏展示等項目,輔助私有云的運維工作。6.外部系統(tǒng)集成對接用戶認證系統(tǒng)(SSO)、運維、項目管理和OA系統(tǒng),使得私有云在管理上和規(guī)范上向全行看齊,如圖1所示。(二)自動化運維平臺建設。一是實現(xiàn)作業(yè)調(diào)度,實現(xiàn)將開發(fā)、運維、測試的腳本、作業(yè)等,按照一定條件、順序和編排在指定的系統(tǒng)中執(zhí)行,實現(xiàn)自動化運維、巡檢、系統(tǒng)備份、業(yè)務系統(tǒng)維護等操作。二是實現(xiàn)自動應用部署,按照編寫好的事務,自動化地調(diào)用私有云接口、系統(tǒng)腳本、應用腳本及相關介質(zhì),自動化部署應用。三是實現(xiàn)應用的資源動態(tài)、靈活分配,在突發(fā)業(yè)務高峰中新增應用節(jié)點、配置負載均衡,在故障中按既定程序啟、停節(jié)點,防止業(yè)務壓力奔潰的“雪崩”效應。四是實現(xiàn)自動化的應急切換、自動恢復高可用性集群,以及自動化的災備切換等,實現(xiàn)業(yè)務連續(xù)性。
四、帶來的改變
(一)大幅提高資源效率,做到綠色節(jié)能。從多年建設情況看,資源使用率提高了6倍,物理機減少85%,空間占用減少了5倍,每年可節(jié)約50%的電費。(二)大幅提高效率、靈活性、可用性。實現(xiàn)IT資源的按需獲取,資源提供從原3-6個月縮短至2個小時內(nèi),實現(xiàn)了靈活、動態(tài)分配資源,經(jīng)受住了多個業(yè)務高峰的考驗,減輕了運維壓力,降低了操作風險,也為法人行社的特色業(yè)務開展提供了科技支撐。(三)極大地提高了高可用性。一是提供了可用于實現(xiàn)高可用性及災備的新工具。二是虛擬化與自動化運維相結(jié)合,提高了高可用性。三是改善災備建設方式,信息系統(tǒng)可通過配置數(shù)據(jù)快速在災備端恢復。(四)改變了IT資源管理方式。一是原煙囪式建設變成基于容量分析、資源統(tǒng)籌的資源池管理方式。二是需要進行自動化、智能化運維工具建設,輔助人員管理資源、分析問題。三是在監(jiān)控方面,需要應用、網(wǎng)絡、虛擬機與物理機等全方位聯(lián)合監(jiān)控、關聯(lián)分析,否則會出現(xiàn)虛機監(jiān)控指標正常,但實際物理機資源耗盡、業(yè)務失敗的情況。(五)改變了開發(fā)、運維的關系,迫切需要實現(xiàn)。DevOps一方面,開發(fā)需了解運維工具,以及資源的動態(tài)、靈活調(diào)度、自動化多中心部署等,復用自動化運維工具調(diào)整應用架構(gòu)的實現(xiàn)。另一方面,運維需要前移到開發(fā),需要培訓新工具、討論應用架構(gòu)、提出系統(tǒng)自動化及智能化運維的功能需求等工作。
五、啟示
隨著我國經(jīng)濟發(fā)展進入新常態(tài),移動互聯(lián)網(wǎng)時代來臨,金融科技浪潮的進一步?jīng)_擊需要科技與業(yè)務之間進行聯(lián)合創(chuàng)新來適應新環(huán)境。科技部門應利用微服務、中臺等新理念新工具,實現(xiàn)業(yè)務服務能力的云化,提供快速創(chuàng)新和容錯試錯的能力。業(yè)務服務能力的云化建設,是一個需要從體制機制改革、科技組織配套建設、業(yè)務梳理到科技建設的全局性全行級戰(zhàn)略的“一把手工程”。一是云化銀行客戶、數(shù)據(jù)、存、貸、匯等業(yè)務功能。一方面,為前臺業(yè)務提供可編排、受管理、自動化、自服務、靈活動態(tài)的基礎服務能力,如客戶管理、信用管理、資金管理、貸款管理、支付清算、外聯(lián)服務、流程管理、檢索服務、數(shù)據(jù)服務、報表服務等一系列公共的基礎服務能力。另一方面,通過服務編排,快速整合成完整的金融服務場景,實現(xiàn)敏捷開發(fā)。服務化可以通過以下6步方法論來實現(xiàn):第一抽象化,定義企業(yè)所提供服務的本質(zhì),找到核心的業(yè)務服務能力;圖1 IaaS云架構(gòu)SDNHypervisor虛擬化層用戶管理資源管理服務交付運維功能外部集成安全合規(guī)云管理平臺物理資源池網(wǎng)絡計算和存儲安全負載均衡第二虛擬化,通過包括信息技術在內(nèi)的各種技術,改造、改進企業(yè)科技架構(gòu),建設大平臺,使之適合云化的服務供給方式;第三標準化,將服務標準化,降低推廣難度、統(tǒng)一服務質(zhì)量,奠定服務自動化提供的基礎;第四資源池化,對服務資源進行集中控制、管理、供給、擴容、回收等;第五自動化,實現(xiàn)自動、高效、可靠、可擴展的服務供給方式;第六服務化,建設管理平臺,有機整合資源、貫徹管理理念,提供對業(yè)務能力的云化管理,實現(xiàn)通過服務編排、發(fā)現(xiàn)及調(diào)度,快速定制行業(yè)務系統(tǒng),各業(yè)務的資源自動化調(diào)度、高可用性、容災也都作為一種服務,由平臺編排、發(fā)現(xiàn)及調(diào)度,實現(xiàn)業(yè)務快速創(chuàng)新。二是以分布式的理念,對業(yè)務進行梳理,保障業(yè)務的多個子業(yè)務按照既定的業(yè)務規(guī)則并行同方向執(zhí)行,保障數(shù)據(jù)一致性,提高系統(tǒng)性能及用戶體驗。進行業(yè)務的梳理分析,整理全行的業(yè)務、業(yè)務場景及目標客戶、業(yè)務間的關聯(lián)關系及業(yè)務內(nèi)部使用到的服務等;對業(yè)務每一個環(huán)節(jié)的一致性、可用性的要求進行分析;基于以上分析結(jié)果,結(jié)合BASE的方法論,進行業(yè)務系統(tǒng)、流程的設計,設計統(tǒng)一的接口、調(diào)用及調(diào)度標準;結(jié)合異步、同步機制,進行分布式服務接口冪等性(同一事務多次執(zhí)行結(jié)果和一次執(zhí)行相同)、會話、鎖、事務、搜索、緩存、消息隊列、負載均衡、統(tǒng)一配置中心、存儲、數(shù)據(jù)庫分庫分表、限流、熔斷、降級等設計,最終達到一致性、可靠性、性能、分區(qū)容忍性及客戶體驗的有機統(tǒng)一。三是加強CD/CI及DevOps能力建設,實現(xiàn)在線的測試、驗證、部署、回退能力,提供試錯容錯能力。四是建設貫穿全業(yè)務生命周期、自動化、智能化的一體化監(jiān)控,為故障的自動定位與排除,資源、高可用性及容災的自動化調(diào)度提供支撐。五是建立從科技管理、科技運維到科技運營轉(zhuǎn)變的體系,更好地支撐業(yè)務,實現(xiàn)成本管理。
參考文獻:
[1]鄧厚.云計算數(shù)據(jù)中心中的虛機部署優(yōu)化研究[D].合肥:中國科學技術大學,2018.
[2]NengHuang.ConstructionofHigh-AvailabilityBankSysteminVirtualizedEnvironments[C].IEEEInternationalconferenceondatascienceincyberspace,2017:561-568.
[3]喻德祿,郭世龍,丁樹晶.中小銀行基于微服務架構(gòu)的應用服務體系研究與實踐[J].中國金融電腦,2018(3):30-33.
作者:黃能 單位:福建省農(nóng)村信用社聯(lián)合社