中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

一行命令導(dǎo)致的數(shù)據(jù)丟失,阿里工程師是如何恢復(fù)的?

2019-09-09    來源:raincent

容器云強(qiáng)勢上線!快速搭建集群,上萬Linux鏡像隨意使用

 

導(dǎo)讀:數(shù)據(jù)安全性被提到了前所未有的高度,數(shù)據(jù)保護(hù)的話題越來越成為敏感。因?yàn),業(yè)務(wù)的中斷時間對用戶造成的影響愈來愈大。阿里技術(shù)專家凡鈞從數(shù)據(jù)安全的形勢與發(fā)展,面臨的挑戰(zhàn),問題的定義,傳統(tǒng)的解決方案,當(dāng)前云廠商的解決方案,去闡述什么是連續(xù)數(shù)據(jù)保護(hù)并提出了彈性的可驗(yàn)證的連續(xù)數(shù)據(jù)保護(hù)方案(Elastic Assured Continuous Data Protection)。

一、摘要

相比于傳統(tǒng)的連續(xù)數(shù)據(jù)保護(hù)等的解決方案,需要在Guest OS 層面或者在專有的存儲層面,進(jìn)行寫時數(shù)據(jù)變化日志的獲取,或多或少對生產(chǎn)機(jī)的存儲性能有很大的影響,一旦上云,必將加重客戶的計算成本及存儲成本。即使是混合的架構(gòu)部署,在網(wǎng)絡(luò)的帶寬,實(shí)施的復(fù)雜性層面也很難與云端實(shí)施相比,很難滿足傳統(tǒng)企業(yè)客戶的更低的RPO(Recovery Point Objective)及RTO(Recovery Time Objective)的訴求。雖然,連續(xù)數(shù)據(jù)保護(hù)的產(chǎn)品定位與快照,復(fù)制(Replication)的功能有所重合,但CDP的定位更加寬泛,注重數(shù)據(jù)的保護(hù),恢復(fù),更高效的業(yè)務(wù)連續(xù)性,不僅僅局限于快照的實(shí)現(xiàn)及數(shù)據(jù)的搬移。

新的Pangu2.0的塊存儲的全新的架構(gòu)為實(shí)現(xiàn)云端連續(xù)性數(shù)據(jù)保護(hù)提供了契機(jī),特別是日志結(jié)構(gòu)塊設(shè)備(Log Structure Block Device),其中包括:全新的數(shù)據(jù)寫入方式,日志存儲方式及快照方式等都極大地方便了連續(xù)數(shù)據(jù)保護(hù)的的實(shí)現(xiàn)。相信隨著企業(yè)上云的加速,在兼顧存儲性能的同時,將會滿足傳統(tǒng)高級企業(yè)用戶的低RTO及低RPO的數(shù)據(jù)保護(hù)的緊迫需求。但數(shù)據(jù)備份及數(shù)據(jù)備份在考慮可操作的同時,數(shù)據(jù)可恢復(fù)的操作性在很大程度上決定了數(shù)據(jù)保護(hù)的有效性。

二、數(shù)據(jù)保護(hù)的挑戰(zhàn)

在當(dāng)今,數(shù)據(jù)安全性被提到了前所未有的高度,數(shù)據(jù)保護(hù)的話題越來越成為敏感。因?yàn),業(yè)務(wù)的中斷時間對用戶造成的影響愈來愈大。在2017年,病毒,勒索軟件,如WannCry, Peta 及 Locky及頻繁的刪庫誤操作,甚至有些對用戶的備份軟件進(jìn)行直接攻擊,使得云端用戶對數(shù)據(jù)安全及數(shù)據(jù)保護(hù)的期望愈來愈高。

 

 

數(shù)據(jù)變得越來越重要: 數(shù)據(jù)=資產(chǎn) 數(shù)據(jù)=資源

2017年1月,“Gitlab誤刪庫事件”引起業(yè)界對信息安全和重大風(fēng)險的敏感神經(jīng)。值得關(guān)注的是,在Gitlab恢復(fù)的過程中,發(fā)現(xiàn)只有db1.staging的數(shù)據(jù)庫可以用于恢復(fù),而其它的5種備份機(jī)制都不可用。而db1.staging 是6小時前的數(shù)據(jù),而且傳輸速率有限,導(dǎo)致恢復(fù)進(jìn)程緩慢,Gitlab 最終丟掉了差不多6個小時的數(shù)據(jù)。

因此,如何降低數(shù)據(jù)丟失的風(fēng)險,減小數(shù)據(jù)保護(hù)的窗口,降低用戶的損失,提供高效的恢復(fù)機(jī)制,是用戶的迫切需要。另外,從一個側(cè)面可以看出,低RTO及可驗(yàn)證的恢復(fù)性,對數(shù)據(jù)保護(hù)的重要性;數(shù)據(jù)的可恢復(fù)性相對于存儲成本在此刻是及其重要的救命稻草。

三、連續(xù)性數(shù)據(jù)保護(hù)的定義

存儲網(wǎng)絡(luò)協(xié)會(SNIA)對于連續(xù)性數(shù)據(jù)保護(hù)的定義為:連續(xù)數(shù)據(jù)保護(hù)是一套方法,它可以捕獲或跟蹤數(shù)據(jù)的變化,并將其獨(dú)立保存放在生產(chǎn)數(shù)據(jù)以外,以確保數(shù)據(jù)可以恢復(fù)到過去的任意時間點(diǎn)。連續(xù)數(shù)據(jù)保護(hù),可以基于塊、文件或應(yīng)用實(shí)現(xiàn),可以為恢復(fù)提供足夠的恢復(fù)粒度,實(shí)現(xiàn)幾乎無限多的恢復(fù)時間點(diǎn)。

全球最具權(quán)威的IT研究與顧問咨詢公司(Gartner)的定義為:連續(xù)數(shù)據(jù)保護(hù)是一種恢復(fù)方法,它連續(xù)或者近似連續(xù)的捕獲或跟蹤數(shù)據(jù)文件或者數(shù)據(jù)塊的變化,同時以日志的形式進(jìn)行保存。這種能力提供了更加細(xì)粒度的實(shí)時點(diǎn),以減少數(shù)據(jù)的的丟失,并且使得任意的恢復(fù)點(diǎn)成為可能。一些CDP解決方案可以被配置去抓取連續(xù)的數(shù)據(jù)改變(真的CDP)或者以一定的時間抓取數(shù)據(jù)改變(準(zhǔn)CDP)。

為了更好的表達(dá)CDP的狀態(tài),需要引入兩個概念:RPO和RTO。

RPO(Recovery Point Objective):恢復(fù)點(diǎn)目標(biāo),指出現(xiàn)災(zāi)難的時候會丟失多長時間的數(shù)據(jù),即是備份間隔。

RTO(Recovery Time Objective):恢復(fù)時間目標(biāo),指出現(xiàn)災(zāi)難的時候多長時間可以讓業(yè)務(wù)繼續(xù)運(yùn)作,即恢復(fù)時間。

真正的CDP概念被定義為RPO=0,RTO趨近于0,才能被成為CDP。當(dāng)RPO不為0時稱之為:Near CDP(準(zhǔn)CDP)。

 

 

四、連續(xù)性數(shù)據(jù)保護(hù)的特點(diǎn)

傳統(tǒng)的數(shù)據(jù)保護(hù)解決方案專注在對數(shù)據(jù)的周期性備份上,因此一直伴隨有備份窗口、數(shù)據(jù)一致性以及對生產(chǎn)系統(tǒng)的影響等問題。而CDP為用戶提供了新的數(shù)據(jù)保護(hù)手段,系統(tǒng)管理者無須關(guān)注數(shù)據(jù)的備份過程(因?yàn)镃DP系統(tǒng)會不斷監(jiān)測關(guān)鍵數(shù)據(jù)的變化,從而不斷地自動實(shí)現(xiàn)數(shù)據(jù)的保護(hù)),而是僅僅當(dāng)災(zāi)難發(fā)生后,簡單地選擇需要恢復(fù)到的數(shù)據(jù)備份時間點(diǎn)即可實(shí)現(xiàn)數(shù)據(jù)的快速恢復(fù)。

連續(xù)數(shù)據(jù)保護(hù)和傳統(tǒng)的災(zāi)難恢復(fù)技術(shù)相比,連續(xù)數(shù)據(jù)保護(hù)具有如下明顯的特點(diǎn):

1、首先可以大大提高數(shù)據(jù)恢復(fù)時間點(diǎn)目標(biāo)(RPO)。備份技術(shù)實(shí)現(xiàn)的數(shù)據(jù)保護(hù)間隔一般為24小時(每天備份一次),因此用戶會面臨數(shù)據(jù)丟失多達(dá)24小時的風(fēng)險,采用快照技術(shù),可以將數(shù)據(jù)的丟失風(fēng)險降低到幾個小時之內(nèi),而CDP能夠?qū)崿F(xiàn)的數(shù)據(jù)丟失量可以降低到幾秒(當(dāng)然,不同的CDP產(chǎn)品和解決方案提供的時間精度也不盡相同)。實(shí)際上,在傳統(tǒng)數(shù)據(jù)保護(hù)技術(shù)中采用的是對“單時間點(diǎn)(SinglePoint-In-Time)”的數(shù)據(jù)拷貝進(jìn)行管理的模式,而連續(xù)數(shù)據(jù)保護(hù)保護(hù)可以實(shí)現(xiàn)對“任意時間點(diǎn)(Any Point-In-Time)”的數(shù)據(jù)保護(hù)。

2、雖然復(fù)制(Replication)技術(shù)可以通過與生產(chǎn)數(shù)據(jù)的同步獲得數(shù)據(jù)的最新狀態(tài),但其無法規(guī)避由人為的邏輯錯誤或病毒攻擊所造成的數(shù)據(jù)丟失。當(dāng)生產(chǎn)數(shù)據(jù)由于以上原因?qū)е聰?shù)據(jù)遭到破壞時(例如數(shù)據(jù)被誤刪除),復(fù)制技術(shù)會將遭到破壞的數(shù)據(jù)狀態(tài)同步到后備數(shù)據(jù)存儲系統(tǒng),使后備數(shù)據(jù)也受到破壞。CDP系統(tǒng)可以使數(shù)據(jù)狀態(tài)恢復(fù)到數(shù)據(jù)遭到破壞之前的任意一個時間點(diǎn),也就可以消除前者具有的風(fēng)險。

3、由于恢復(fù)時間和恢復(fù)對象的粒度更細(xì),所以連續(xù)數(shù)據(jù)保護(hù)保護(hù)的數(shù)據(jù)恢復(fù)也更加靈活。目前的部分產(chǎn)品和解決方案允許最終用戶(而不僅僅是系統(tǒng)管理員)直接對數(shù)據(jù)進(jìn)行恢復(fù)操作,這在很大程度上方便了使用者。

 

 

五、實(shí)現(xiàn)方式

連續(xù)數(shù)據(jù)保護(hù)實(shí)現(xiàn)的關(guān)鍵技術(shù)是對數(shù)據(jù)變化的記錄和保存,以便實(shí)現(xiàn)任意時間點(diǎn)的快速恢復(fù)。一般來講,有三種實(shí)現(xiàn)方式:

基準(zhǔn)參考數(shù)據(jù)模式。建立參考數(shù)據(jù)拷貝,根據(jù)生產(chǎn)數(shù)據(jù)變化記錄數(shù)據(jù)差異日志,根據(jù)日志差異按需恢復(fù)數(shù)據(jù)。基準(zhǔn)參考數(shù)據(jù)模式原理簡單,實(shí)現(xiàn)起來比較容易,但由于數(shù)據(jù)恢復(fù)時需要從最原始的參考數(shù)據(jù)開始,逐步進(jìn)行數(shù)據(jù)恢復(fù),因此恢復(fù)時間比較長,尤其是恢復(fù)時間點(diǎn)越靠近當(dāng)前的時間,恢復(fù)所需要的時間就越長。

復(fù)制參考數(shù)據(jù)模式。生產(chǎn)數(shù)據(jù)和參考數(shù)據(jù)副本實(shí)時同步,在同步的同時記錄回退日志或事件,基于回退日志(Undo Log)差異實(shí)現(xiàn)數(shù)據(jù)按需恢復(fù)。復(fù)制參考數(shù)據(jù)模式和基準(zhǔn)參考數(shù)據(jù)模式在實(shí)現(xiàn)原理上恰好相反。復(fù)制參考數(shù)據(jù)模式在數(shù)據(jù)恢復(fù)時,恢復(fù)的時間點(diǎn)越靠近當(dāng)前,所需要的恢復(fù)時間越短。但在數(shù)據(jù)的保存過程中,需要同時進(jìn)行數(shù)據(jù)和日志記錄的同步,需要較多的系統(tǒng)資源。

合成參考數(shù)據(jù)模式。合成參考數(shù)據(jù)模式是以上兩種模式的折衷,較好地實(shí)現(xiàn)了以上兩種模式的妥協(xié),因此可以得到較好的資源占用和恢復(fù)時間效果。但需要復(fù)雜的軟件管理和數(shù)據(jù)處理功能,實(shí)現(xiàn)起來比較復(fù)雜。 連續(xù)數(shù)據(jù)保護(hù)技術(shù)或解決方案的實(shí)現(xiàn)有多種模式。

不同的傳統(tǒng)廠商建立了不同的連續(xù)數(shù)據(jù)保護(hù)保護(hù)模型,參考SNIA的存儲共享模型, 可以將實(shí)現(xiàn)連續(xù)數(shù)據(jù)保護(hù)的產(chǎn)品或解決方案分為基于應(yīng)用、基于文件和基于數(shù)據(jù)塊的連續(xù)數(shù)據(jù)保護(hù)保護(hù)。本文主要從數(shù)據(jù)塊層面講CDP的實(shí)現(xiàn);趬K的CDP功能直接運(yùn)行在物理的存儲設(shè)備或邏輯的卷管理器上,甚至也可以運(yùn)行在數(shù)據(jù)傳輸層上。當(dāng)數(shù)據(jù)塊寫入生產(chǎn)數(shù)據(jù)的存儲設(shè)備時,CDP系統(tǒng)可以捕獲數(shù)據(jù)的拷貝并將其存放在另外一個存儲設(shè)備中。 基于數(shù)據(jù)塊的數(shù)據(jù)保護(hù)又有基于主機(jī)層、基于傳輸層和基于存儲層三類實(shí)現(xiàn)方式。

六、傳統(tǒng)數(shù)據(jù)保護(hù)產(chǎn)品的CDP

下面以FalconStorCDP、VeeamCDP及EMC RecoverPoint這3個廠商,從不同背景進(jìn)行分析,具有一定的代表性:飛康是傳統(tǒng)的連續(xù)數(shù)據(jù)保護(hù)產(chǎn)品的代表。EMC傳統(tǒng)的存儲廠商,收購以前的RecoverPoint打造自己的數(shù)據(jù)保護(hù)套件, 方案建立在自己的存儲上,提供物理機(jī)到虛擬機(jī)的保護(hù)方案。Veeam 是虛擬機(jī)保護(hù)的后起之秀,主打虛擬化平臺上,VMWARE 及 HYPERV的數(shù)據(jù)保護(hù),擴(kuò)展到云端,目前的方案依賴于VMWare的VAIO 虛擬化數(shù)據(jù)獲取框架。

 

 

 

 

EMCRecoverPoint/SE 是針對 EMC CLARiiON 系列陣列的全面解決方案,而 EMC RecoverPoint則是針對整個數(shù)據(jù)中心的全面解決方案。兩種產(chǎn)品都提供了使用連續(xù)數(shù)據(jù)保護(hù) (CDP)的同步本地復(fù)制,以及具有任意時間點(diǎn)恢復(fù)功能的同步和異步連續(xù)遠(yuǎn)程復(fù)制 (CRR)。在RecoverPoint 應(yīng)用裝置上同時運(yùn)行CDP和CRR實(shí)現(xiàn)本地和遠(yuǎn)程(CLR) 數(shù)據(jù)保護(hù),使您能夠用單個解決方案同時在本地和遠(yuǎn)程保護(hù)相同數(shù)據(jù)。 飛康CDP解決方案整合了數(shù)據(jù)備份、系統(tǒng)恢復(fù)、災(zāi)難恢復(fù)、本地及異地容災(zāi)等多項功能。飛康CDP是基于磁盤的備份與容災(zāi)一體化解決方案,實(shí)現(xiàn)文件/數(shù)據(jù)庫/操作系統(tǒng)的實(shí)時備份與瞬間恢復(fù);實(shí)現(xiàn)了驗(yàn)證、演練的本地/異地容災(zāi)功能整合。

七、主要云廠商的數(shù)據(jù)保護(hù)方式

AWS僅提供原生的快照功能及幫助客戶上云的手段,數(shù)據(jù)備份等功能依賴于傳統(tǒng)的數(shù)據(jù)保護(hù)廠商;Azure提供基于虛擬機(jī)的基本的備份及恢復(fù)方式,沒有提供CDP等高級功能。

 

 

 

 

八、可驗(yàn)證的彈性的連續(xù)數(shù)據(jù)保護(hù)CDP

根據(jù)Gartner的描述的彈性的云備份引擎,其中規(guī)定的了成功彈性備份的幾個特征:

彈性的云備份引擎需要快速的RTO,這就要求備份引擎和數(shù)據(jù)恢復(fù)在一個數(shù)據(jù)中心。

彈性的云備份引擎需要有全備份,沒有過大的WAN數(shù)據(jù)傳輸,將備份與生產(chǎn)機(jī)職責(zé)分開。

并且要確保數(shù)據(jù)的可恢復(fù)性。

 

 

連續(xù)數(shù)據(jù)保護(hù)CDP本質(zhì)上作為一種高級的數(shù)據(jù)保護(hù)方案,由云廠商進(jìn)行,具有傳統(tǒng)備份所不具有的彈性。傳統(tǒng)廠商為了上云,必然需要將數(shù)據(jù)經(jīng)過WAN傳輸?shù)皆贫,必然耗費(fèi)CPU資源,必然耗費(fèi)IO資源。為了躲避資源的耗費(fèi),可能采取定時開啟的任務(wù)方式,連基本的彈性的備份都保證不了,更談不上CDP?沈(yàn)證性,強(qiáng)調(diào)了CDP方案的可靠性,可操作性。為了保證應(yīng)用程序的數(shù)據(jù)的跨卷一致性,需要卷之間建立一致性組(Consistency Group)及應(yīng)用程序的一致性(Application Consistency)。

 

 

九、結(jié)論

數(shù)據(jù)保護(hù)不是亡羊補(bǔ)牢,需要未雨綢繆。隨著企業(yè)上云的快速增長,傳統(tǒng)企業(yè)對云端數(shù)據(jù)保護(hù)的訴求更加突出;隨著數(shù)據(jù)重要性的日益提高,用戶對數(shù)據(jù)丟失的敏感程度前所未有,從而使得云端數(shù)據(jù)保護(hù)與用戶需求之間的矛盾更加凸顯。傳統(tǒng)的基于塊存儲的連續(xù)數(shù)據(jù)保護(hù)因?yàn)榇蠖嘁蕾囉谔囟ǖ拇鎯υO(shè)備,并不具有云端實(shí)現(xiàn)所具有的彈性,并不適應(yīng)云端分布式環(huán)境的復(fù)雜性。連續(xù)數(shù)據(jù)保護(hù)作為傳統(tǒng)或者混合云數(shù)據(jù)保護(hù)的重要補(bǔ)充,定會以新的解決方案的出現(xiàn)而被企業(yè)用戶所重視。全新的Pangu2.0的塊存儲的架構(gòu)為實(shí)現(xiàn)云端連續(xù)性數(shù)據(jù)保護(hù)提供了契機(jī),隨著企業(yè)上云的加速,在兼顧存儲性能的同時,將會滿足傳統(tǒng)高級企業(yè)用戶的低RTO及低RPO的數(shù)據(jù)保護(hù)的緊迫需求。后續(xù)文章將會著重闡述基于基準(zhǔn)參考數(shù)據(jù)模型的云端連續(xù)數(shù)據(jù)保護(hù),該方案基于Pangu2.0的Block Storage實(shí)現(xiàn)連續(xù)性數(shù)據(jù)保護(hù),著重描述連續(xù)數(shù)據(jù)保護(hù)的秒級數(shù)據(jù)恢復(fù)機(jī)制。

參考:
https://www.snia.org/sites/default/education/tutorials/2007/spring/data-management/Trends_in_Data_Protection_CDP_VTL.pdf
https://en.wikipedia.org/wiki/Continuous_data_protection
https://www.gartner.com/it-glossary/continuous-data-protection-cdp/
https://falconstor.com/page/700/continuous-data-protector-cdp
https://www.emc.com/collateral/guide/h12151-ho-emc-15-minute-continuous-availability-services.pdf
https://d1.awsstatic.com/whitepapers/Backup_and_Recovery_Approaches_Using_AWS.pdf
https://www.gartner.com/doc/reprints?id=1-4TIM69I&ct=180320&st=sbhttps://docs.microsoft.com/zh-cn/azure/backup/backup-azure-vms-first-look-arm
https://docs.microsoft.com/zh-cn/azure/backup/backup-azure-restore-files-from-vm
https://azure.microsoft.com/zh-cn/blog/large-disk-support/
https://amazonaws-china.com/cn/backup-restore/
http://everrundoc.stratus.com/7.2.1.0/en-us/Content/Help/P01_Users/C08_MngVMs/S03_ConfigWindowsVM/T_InstallQEMUWindowsVM.htm
http://www.arcserve.com/fr/~/media/files/whitepapers/ca-arcserve-family-r16-improving-system-and-data-protection.aspx
https://www.emc.com/collateral/software/white-papers/h4175-recoverpoint-clr-operational-dr-wp.pdf

標(biāo)簽: 數(shù)據(jù)丟失 數(shù)據(jù)安全

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:更快更準(zhǔn)的未來治療,AI在這5個方面交出滿意答卷

下一篇:盲目崇拜數(shù)據(jù),是因?yàn)檫不曾真正了解數(shù)據(jù)