中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

圖形數(shù)據(jù)庫的優(yōu)點:更簡單的數(shù)據(jù)建模和分析

2019-02-27    來源:raincent

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

作為咨詢公司Booz Allen Hamilton首席數(shù)據(jù)科學家,Kirk Borne是從數(shù)據(jù)連接角度來看這個世界。Borne稱:“生活是關于,誰連接到誰,什么連接到什么。”他指出圖形數(shù)據(jù)庫和圖形分析應用程序是利用這種連接的新方法。

這是因為,圖形數(shù)據(jù)庫(NoSQL軟件的一種形式)記錄數(shù)據(jù)點之間連接的方式與主流關系數(shù)據(jù)庫完全不同。圖形系統(tǒng)不是將數(shù)據(jù)作為表格中的元素,而是作為節(jié)點,通過邊緣相互鏈接,其中有一組屬性表明節(jié)點之間關系。

因此,圖形數(shù)據(jù)庫的一個優(yōu)點是,它們允許數(shù)據(jù)分析師瀏覽數(shù)據(jù)集,而無需創(chuàng)建和運行復雜查詢以將表組合在一起,正如在關系模型中那樣。

Borne說:“從數(shù)據(jù)發(fā)現(xiàn)的角度來看,圖形更具意義”。根據(jù)Borne和其他人的說法,當圖形算法和分析工具應用于數(shù)據(jù)集時,基本功能(例如聚類、分區(qū)、搜索和估計節(jié)點之間的最短路徑)會暴露數(shù)據(jù)中的模式。

圖形用例增加

Borne指出,圖表方法已成為部分主流在線應用的基礎。這包括谷歌搜索引擎及其Knowledge Graph中的頁面排名系統(tǒng),Knowledge Graph匯集來自各種在線資源的事實數(shù)據(jù)。 Facebook和LinkedIn也在使用圖表來映射朋友圈和關系網(wǎng)。此外,圖形分析還用于在線推薦引擎。

在這些情況中,這些應用程序都沒有部署在圖形數(shù)據(jù)庫中;圖形可在各種平臺中構(gòu)建、存儲和管理,包括關系型平臺。供應商和IT團隊對圖形數(shù)據(jù)庫技術的興趣日益濃厚,他們主要關注欺詐檢測、網(wǎng)絡安全、文本分析、數(shù)據(jù)目錄、數(shù)據(jù)管理以及科學研究等。

同時,大數(shù)據(jù)的崛起也在促使更多用戶考慮圖形數(shù)據(jù)庫和圖形數(shù)據(jù)建模方法,Borne稱:“現(xiàn)在,圖形工具還有更多豐富的數(shù)據(jù)可供發(fā)現(xiàn)。”

例如,德國慕尼黑糖尿病研究中心數(shù)據(jù)和知識管理負責人Alexander Jarasch指出,Neo4j Inc.的同名圖形數(shù)據(jù)庫為他們提供了一個平臺,可收集和分享各種基因數(shù)據(jù)和其他與糖尿病有關的信息。

Jarasch說,該中心以德語縮寫DZD被人們所熟知,該中心正在使用Neo4j努力為糖尿病患者創(chuàng)造新療法并找到預防該疾病的方法。他于2017年4月開始使用圖形數(shù)據(jù)庫進行腳本編寫和原型設計工作,去年他的另外兩名團隊成員也加入了這項工作。

圖形數(shù)據(jù)庫供應商Neo4j的Bloom數(shù)據(jù)探索軟件創(chuàng)建的可視化突出展現(xiàn)了公司、人員和城市之間的連接。

再見,數(shù)據(jù)連接

Jarasch從事生物信息學研究長達10多年,他對關系型數(shù)據(jù)庫產(chǎn)生了厭惡,或者說至少對數(shù)據(jù)連接產(chǎn)生厭惡,這通常是關系查詢的核心。他表示:“我討厭連接,當你的數(shù)據(jù)分散在表格中,并試圖尋找見解時,事情會變得很復雜。”

Jarasch和他的同事正在試圖使用Neo4j數(shù)據(jù)庫以便在DZD中更容易地共享各種數(shù)據(jù)。DZD由很多獨立的研究組織組成。根據(jù)Jarasch的說法,這些數(shù)據(jù)來自醫(yī)院、實驗室和其他來源。有些數(shù)據(jù)是關于人類的,還有的則是關于實驗動物。他指出:“每個人都有自己的數(shù)據(jù),他們交換數(shù)據(jù),但沒有任何主要方式來連接數(shù)據(jù)。”這就是他想通過圖形技術實現(xiàn)的目標。

首先的步驟側(cè)重于創(chuàng)建與原始數(shù)據(jù)相關的元數(shù)據(jù),以便研究人員可看到可用于分析的內(nèi)容。隨后再使用圖形分析應用程序。Jarasch表示,他預計今年可以為一兩個研究項目提供數(shù)據(jù),其中包括一個將人類匿名數(shù)據(jù)與小老鼠和豬數(shù)據(jù)關聯(lián)的項目。

盡管部署Neo4j,但Jarasch認為在DZD仍然會需要使用關系數(shù)據(jù)庫。只是說,圖形數(shù)據(jù)庫軟件為研究科學家提供了“查看其數(shù)據(jù)的額外層”。

大量圖形選項

對于希望獲得圖形數(shù)據(jù)庫優(yōu)勢的其他用戶來說,市面上有各種技術選項。除Neo4j之外,原生圖形數(shù)據(jù)庫供應商還包括Cambridge Semantics、Cray、Franz、Ontotext和TigerGraph。云平臺市場領導者AWS也提供圖形數(shù)據(jù)庫,名為Amazon Neptune,該數(shù)據(jù)庫已于2017年底推出。

其他云提供商也有圖形技術。例如微軟的Azure Cosmos DB多模型數(shù)據(jù)庫可用于存儲和管理圖形數(shù)據(jù)。IBM通過名為Compose for JanusGraph的托管服務在其云端支持JanusGraph開源數(shù)據(jù)庫。

此外,甲骨文數(shù)據(jù)庫和Microsoft SQL Server等關系數(shù)據(jù)庫也可進行圖形處理和分析。DataStax、MarkLogic、Redis等其他類型的NoSQL數(shù)據(jù)庫管理系統(tǒng)也支持圖形功能。同時,Apache Spark分析引擎支持并行圖形計算。

歷史上來看,圖形數(shù)據(jù)庫分為兩類。除那些支持具有節(jié)點和邊緣的屬性圖形之外,還有RDF數(shù)據(jù)庫,它是基于Resource Description Framework(資源描述框架),并且關注數(shù)據(jù)的語義方面,信息存儲在包含名詞、動詞和對象的三元組中。但隨著供應商開始支持這兩種類型,這種區(qū)別正在變得模糊。

通過圖形支持電網(wǎng)

劉光懿(Guangyi Liu,音譯)目前正在使用TigerGraph的大規(guī)模并行處理圖形數(shù)據(jù)庫,以構(gòu)建可實時匹配電力供需的系統(tǒng)。

北美全球能源互聯(lián)研究所(GEIRINA)首席技術官劉光懿表示,在電力分配中部署實時分析性能一直是公用事業(yè)行業(yè)的夢想。GEIRINA是位于加利福尼亞州圣何塞的研發(fā)中心,隸屬于中國國家電網(wǎng),這是一家位于北京的政府公用事業(yè)公司。

劉光懿的團隊正在試圖在拓撲上進行大規(guī)模線性方程處理,該拓撲代表來自電網(wǎng)中數(shù)百萬傳感器、執(zhí)行器、繼電器和開關的信號。該項目始于2015年,他們最初測試了甲骨文的關系數(shù)據(jù)庫軟件。但是像Jarasch一樣,劉發(fā)現(xiàn)了關系方法的缺點。

他表示:“對于甲骨文數(shù)據(jù)庫,你需要將表格轉(zhuǎn)換為數(shù)據(jù)結(jié)構(gòu)—體現(xiàn)系統(tǒng)拓撲。然而,對于TigerGraph,拓撲就在那里。”劉表示,圖形數(shù)據(jù)庫還可以并行運行數(shù)據(jù)搜索和計算。

Bloor Research公司分析師Philip Howard表示,他預計圖形技術的應用將繼續(xù)擴大范圍。特別是對于很多現(xiàn)代應用程序中大規(guī)模“誰知道誰?”問題,他指出了圖形數(shù)據(jù)庫相對于關系型軟件的優(yōu)勢。

然而,圖形工具目前主要被用作關系數(shù)據(jù)庫或其他類型的NoSQL系統(tǒng)的附屬物。他指出,圖形可提供一種更自然的方式來建模和連接數(shù)據(jù),但在評估和選擇數(shù)據(jù)管理平臺時,IT團隊仍然傾向于“在表格內(nèi)”思考。

標簽: 安全 大數(shù)據(jù) 谷歌 谷歌搜索引擎 腳本 排名 數(shù)據(jù)分析 數(shù)據(jù)庫 搜索 搜索引擎 網(wǎng)絡 網(wǎng)絡安全

版權申明:本站文章部分自網(wǎng)絡,如有侵權,請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:數(shù)據(jù)科學太難?這些陷阱請避開,正能量很重要!

下一篇:2019年科技發(fā)展預測:云、大數(shù)據(jù)、AI、物聯(lián)網(wǎng)和區(qū)塊鏈