企業備份系統建設規劃,這幾個關鍵問題如何解決?

對于每一個企業來講,數據備份都是必不可少的一項關鍵性工作,它直接決定著企業能夠應對什么樣的數據威脅以及相應解決方案的靈活度和有效性。但是在 IT 飛速發展的今天,每一個企業的應用系統在不斷增加,數據類型在不斷的多樣化,數據的量級也在不斷的擴展。在這種形勢下,如何能把備份系統規劃的科學合理并且高效化是作為 IT 建設者必須考慮的問題。本文通過大量的調研分析總結抽象出備份系統規劃時必須考慮的幾個關鍵性問題,并針對每一個問題進行分析和論述,提出解決思路。希望能給企業進行備份系統建設、改造或者升級的項目帶來一些啟示和幫助。

1. 如何確定備份對象及備份策略

近些年來,企業的數據逐漸呈現多元化格局,從數據的模型層面可以分為結構化數據、半結構化數據、非結構化數據。從企業 IT 功能層面又可以將常見數據列為如下幾類:

  1. 1、關系型數據庫中保存的二維表數據。

  2. 2、非關系型數據庫中的文檔、 JSON 、鍵值等類型數據。

  3. 3、以文字方式記錄的文本、 PDF 、 XML 等文件形式的數據。

  4. 4、以二進制方式記錄形成的圖片、網頁等數據。

  5. 5、以視頻流方式記錄形成的媒體類數據。

作為企業來講,確定備份哪些數據對象,需要從數據重要性、數據量、數據特點等若干方面去評估。從企業業務角度評估的話,那么數據庫保存的數據一定是最重要的,尤其是關系型數據庫里面的二維表數據。其次需要根據行業特點以及具體的業務系統重要性來評估非結構化數據的重要性。比如對于金融行業來講,記錄業務過程的一些影像類數據可能在業務審核過程中經常被調出查閱,這些數據雖然沒有結構化數據那么重要但是也是業務環節當中必不可少的元素,其重要性相對業務視頻類以及安防類視頻數據會高很多。但是如果是媒體行業的話,那么視頻類數據的重要性恰恰是支撐其業務的核心數據,其重要程度不言而喻。那么如何來決定哪些數據需要備份,以什么樣的策略備份?

首先,我們需要確定數據的重要性程度。本文通過結果導向的思路從以下維度來分析企業數據的重要性,最終決定哪些數據需要備份,哪些數據可以不備份,哪些數據需要根據企業的實際投資戰略情況來決定。首先我們假定一個結果,那就是某個應用系統的某類型數據由于硬件故障或者其他原因導致數據丟失掉了。那么就看企業對該結果的容忍程度,假設不能容忍,那么就沒什么好商量的了,肯定要做備份。接下來,最重要的事情是我們如何定義數據備份的策略,包括備份的頻度、備份的模式、歸檔的檔期等等一系列備份作業元素。這部分內容需要考慮到數據本身的量級、數據的具體類型、極端條件下對數據恢復時間及數據丟失量的容忍程度、數據備份系統以及備份介質本身的性能特性、業務發展的規模及趨勢判斷等等。本文從以下幾個原則來進行評估:

以上是對備份對象的確定以及如何把握具體的備份策略的分析和描述,具體細節及關鍵方法在接下來的章節會有詳細的剖析和介紹。


2. 如何選擇備份架構的問題

2.1 備份系統涉及到的關鍵對象

所謂備份系統中的一些關鍵對象包括:備份軟件、備份介質、備份管理服務器、備份作業服務器、備份路徑等。這些關鍵元素共同組成了一個完成的備份系統。

  1.  備份軟件:常用的備份軟件包括 IBM TSM 、 EMC Networker 、 SYMANTIC NBU 等。

  2.  備份介質:常用的備份介質包括帶庫、 EMC DATADomain 、常規存儲等。

  3.  備份管理服務器:對備份作業進行配置調度并且保存備份元數據的集中管理節點。

  4.  備份作業服務器:具體執行備份作業的備份服務器。

  5.  備份路徑:每一個備份作業從客戶端采集數據到備份介質的整個路徑。

2.2 基于容災功能的備份架構

一般的企業可能只需要進行本地備份即可,但是對于某些行業尤其是金融行業,備份要求比較高,需要采用主數據中心和備數據中心聯動的高可用備份架構。

整體架構從上到下分為三層:備份客戶端層、備份控制層以及數據存儲層。中間通過網絡(以太網絡或者是光纖網絡)相連接。紅色線表示控制信息流向,藍色線表示備份過程中的數據流向。

2.3 備份架構高可用性分析

整個備份系統的高可用性是由每一個部分服務的高可用配置來保障的,主要包括備份控制層、備份存儲介質層以及跨數據中心級別的高可用架構配置。下面我們分別來做剖析:


3. 如何解決非結構化數據備份的問題

3.1 非結構化數據備份面臨的困境

對于存儲在傳統 NAS 文件系統上的文件類數據,如果用通用的備份方法只能通過文件復制的方式來實現其全量和增量備份。但是隨著日積月累的非結構化數據增長,這類數據可能會從 TB 級別發展到 10TB 甚至 PB 級別。這類數據存儲組織的方式是文件系統的樹目錄形式,隨著數據的增加,其目錄的深度和規模也會呈現劇增趨勢。備份軟件在掃描文件目錄的時候會變得非常非常慢,最終導致備份作業慢到超過備份窗口的程度。

3.2 業務管理層面的解決方案

如果從業務管理層面來解決該問題的話,那么就是要讓備份作業在一定時間段內保持在合理的數據量范圍之內,也就是說要形成合理的多級數據緩存,根據數據使用頻度建立多級轉儲以及歸檔體系。保障使用頻度高的數據在日常備份作業范圍內,合理歸檔使用頻率非常低的歷史數據。拿金融行業的票據、信貸類系統來說,我們可以將合理業務周期內的非結構化數據存在在一級緩存當中,保障業務復核階段的數據讀??;將業務周期外的非結構化數據轉儲到二級 NAS 平臺上,保障近期內可能使用到的業務場景;將較長周期之前的數據定義為離線數據,歸檔到歸檔存儲設備當中。備份僅僅涉及到歸檔之前的數據。這樣既可以保障數據存取的性能,又能保障備份作業的長期穩定性,最終保障備份系統整體的安全穩定。

3.3 技術管理層面的解決方案

通過 3.1 章節對問題的原因分析,我們知道導致備份無法進行的原因在于備份軟件對于龐大文件系統目錄的掃描時間過長。那么順著這個思路,如果我們在備份的時候能避免去掃描整個文件系統目錄,而是通過別的方式來完成備份,就可以解決這個問題。通過調查研究我們發現目有兩種方法可以實現:

1) 傳統 NAS 的快照方式。對于傳統的 NAS 存儲來講,快照是非常普遍的功能,通過 NAS 本身的快照復制,我們可以不用掃描文件系統目錄,僅僅基于某一個時刻點的快照,進行卷級別的復制實現全量備份;通過塊兒級別的對比實現增量備份,因為 NAS 設備底層還是基于塊兒設備實現的。當然這種技術需要對存儲本身的快照功能有非常強的依賴性。

2) 分布式 NAS 存儲的日志記錄方式。某些基于分布式技術實現的 NAS 存儲可以對外提供日志操作的接口,也就是說對文件數據的增加和更新會記錄到存儲本身的底層日志當中,那么我們僅僅需要調用日志比對的接口就可以快速找到更新的目錄和文件,僅僅需要掃描更新的部分做增量的復制來完成備份。

以上的兩種技術方案需要我們在做備份規劃之前的選型階段對不同的備份軟件及存儲介質等進行深度調研和分析,盡可能科學合理組合實現以上解決方案。


江蘇國駿信息科技有限公司 蘇ICP備17037372號-2 電話:400-6776-989; 0516-83887908 郵箱:manager@jsgjxx.com          
色视频在线观看