中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

一文理解 Apache Hadoop 機架感知

2018-10-31    來源:raincent

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

背景

分布式的集群通常包含非常多的機器,由于受到機架槽位和交換機網(wǎng)口的限制,通常大型的分布式集群都會跨好幾個機架,由多個機架上的機器共同組成一個分布式集群。機架內(nèi)的機器之間的網(wǎng)絡(luò)速度通常都會高于跨機架機器之間的網(wǎng)絡(luò)速度,并且機架之間機器的網(wǎng)絡(luò)通信通常受到上層交換機間網(wǎng)絡(luò)帶寬的限制。

具體到Hadoop集群,由于hadoop的HDFS對數(shù)據(jù)文件的分布式存放是按照分塊block存儲,每個block會有多個副本(默認為3),并且為了數(shù)據(jù)的安全和高效,所以hadoop默認對3個副本的存放策略為:

第一個block副本放在和client所在的node里(如果client不在集群范圍內(nèi),則這第一個node是隨機選取的)。

第二個副本放置在與第一個節(jié)點不同的機架中的node中(隨機選擇)。

第三個副本似乎放置在與第一個副本所在節(jié)點同一機架的另一個節(jié)點上

如果還有更多的副本就隨機放在集群的node里。

這樣的策略可以保證對該block所屬文件的訪問能夠優(yōu)先在本rack下找到,如果整個rack發(fā)生了異常,也可以在另外的rack上找到該block的副本。這樣足夠的高效,并且同時做到了數(shù)據(jù)的容錯。

但是,hadoop對機架的感知并非是自適應(yīng)的,亦即,hadoop集群分辨某臺slave機器是屬于哪個rack并非是只能的感知的,而是需要hadoop的管理者人為的告知hadoop哪臺機器屬于哪個rack,這樣在hadoop的namenode啟動初始化時,會將這些機器與rack的對應(yīng)信息保存在內(nèi)存中,用來作為對接下來所有的HDFS的寫塊操作分配datanode列表時(比如3個block對應(yīng)三臺datanode)的選擇datanode策略,做到hadoop allocate block的策略:盡量將三個副本分布到不同的rack。

接下來的問題就是:通過什么方式能夠告知hadoop namenode哪些slaves機器屬于哪個rack?以下是配置步驟。

配置

默認情況下,hadoop的機架感知(Rack Awareness)是沒有被啟用的。所以,在通常情況下,hadoop集群的HDFS在選機器的時候,是隨機選擇的,也就是說,很有可能在寫數(shù)據(jù)時,hadoop將第一塊數(shù)據(jù)block1寫到了rack1上,然后隨機的選擇下將block2寫入到了rack2下,此時兩個rack之間產(chǎn)生了數(shù)據(jù)傳輸?shù)牧髁,再接下來,在隨機的情況下,又將block3重新又寫回了rack1,此時,兩個rack之間又產(chǎn)生了一次數(shù)據(jù)流量。在job處理的數(shù)據(jù)量非常的大,或者往hadoop推送的數(shù)據(jù)量非常大的時候,這種情況會造成rack之間的網(wǎng)絡(luò)流量成倍的上升,成為性能的瓶頸,進而影響作業(yè)的性能以至于整個集群的服務(wù)。

要將hadoop機架感知的功能啟用,配置非常簡單,在namenode所在機器的hadoop-site.xml配置文件中配置一個選項:

 

 

這個配置選項的value指定為一個可執(zhí)行程序,通常為一個腳本,該腳本接受一個參數(shù),輸出一個值。接受的參數(shù)通常為某臺datanode機器的ip地址,而輸出的值通常為該ip地址對應(yīng)的datanode所在的rack,例如”/rack1”。Namenode啟動時,會判斷該配置選項是否為空,如果非空,則表示已經(jīng)用機架感知的配置,此時namenode會根據(jù)配置尋找該腳本,并在接收到每一個datanode的heartbeat時,將該datanode的ip地址作為參數(shù)傳給該腳本運行,并將得到的輸出作為該datanode所屬的機架,保存到內(nèi)存的一個map中。

至于腳本的編寫,就需要將真實的網(wǎng)絡(luò)拓樸和機架信息了解清楚后,通過該腳本能夠?qū)C器的ip地址正確的映射到相應(yīng)的機架上去。一個簡單的實現(xiàn)如下:

 

 

由于沒有找到確切的文檔說明 到底是主機名還是ip地址會被傳入到腳本,所以在腳本中最好兼容主機名和ip地址,如果機房架構(gòu)比較復雜的話,腳本可以返回如:/dc1/rack1 類似的字符串。

執(zhí)行命令:chmod +x RackAware.py

重啟namenode,如果配置成功,namenode啟動日志中會輸出:

 

 

網(wǎng)絡(luò)拓撲機器之間的距離

這里基于一個網(wǎng)絡(luò)拓撲案例,介紹在復雜的網(wǎng)絡(luò)拓撲中hadoop集群每臺機器之間的距離

 

 

 

有了機架感知,NameNode就可以畫出上圖所示的datanode網(wǎng)絡(luò)拓撲圖。D1,R1都是交換機,最底層是datanode。則H1的rackid=/D1/R1/H1,H1的parent是R1,R1的是D1。這些rackid信息可以通過topology.script.file.name配置。有了這些rackid信息就可以計算出任意兩臺datanode之間的距離。

 

標簽: 安全 機房 腳本 通信 網(wǎng)絡(luò)

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:正在被巨大數(shù)據(jù)中心吞噬的全球電力,谷歌臉書和比特幣的“源”罪

下一篇:大數(shù)據(jù)技術(shù)在金融行業(yè)中的應(yīng)用