中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

圖形數(shù)據(jù)庫(kù)的優(yōu)點(diǎn):更簡(jiǎn)單的數(shù)據(jù)建模和分析

2019-02-27    來(lái)源:raincent

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬(wàn)Linux鏡像隨意使用

作為咨詢公司Booz Allen Hamilton首席數(shù)據(jù)科學(xué)家,Kirk Borne是從數(shù)據(jù)連接角度來(lái)看這個(gè)世界。Borne稱:“生活是關(guān)于,誰(shuí)連接到誰(shuí),什么連接到什么。”他指出圖形數(shù)據(jù)庫(kù)和圖形分析應(yīng)用程序是利用這種連接的新方法。

這是因?yàn),圖形數(shù)據(jù)庫(kù)(NoSQL軟件的一種形式)記錄數(shù)據(jù)點(diǎn)之間連接的方式與主流關(guān)系數(shù)據(jù)庫(kù)完全不同。圖形系統(tǒng)不是將數(shù)據(jù)作為表格中的元素,而是作為節(jié)點(diǎn),通過(guò)邊緣相互鏈接,其中有一組屬性表明節(jié)點(diǎn)之間關(guān)系。

因此,圖形數(shù)據(jù)庫(kù)的一個(gè)優(yōu)點(diǎn)是,它們?cè)试S數(shù)據(jù)分析師瀏覽數(shù)據(jù)集,而無(wú)需創(chuàng)建和運(yùn)行復(fù)雜查詢以將表組合在一起,正如在關(guān)系模型中那樣。

Borne說(shuō):“從數(shù)據(jù)發(fā)現(xiàn)的角度來(lái)看,圖形更具意義”。根據(jù)Borne和其他人的說(shuō)法,當(dāng)圖形算法和分析工具應(yīng)用于數(shù)據(jù)集時(shí),基本功能(例如聚類、分區(qū)、搜索和估計(jì)節(jié)點(diǎn)之間的最短路徑)會(huì)暴露數(shù)據(jù)中的模式。

圖形用例增加

Borne指出,圖表方法已成為部分主流在線應(yīng)用的基礎(chǔ)。這包括谷歌搜索引擎及其Knowledge Graph中的頁(yè)面排名系統(tǒng),Knowledge Graph匯集來(lái)自各種在線資源的事實(shí)數(shù)據(jù)。 Facebook和LinkedIn也在使用圖表來(lái)映射朋友圈和關(guān)系網(wǎng)。此外,圖形分析還用于在線推薦引擎。

在這些情況中,這些應(yīng)用程序都沒(méi)有部署在圖形數(shù)據(jù)庫(kù)中;圖形可在各種平臺(tái)中構(gòu)建、存儲(chǔ)和管理,包括關(guān)系型平臺(tái)。供應(yīng)商和IT團(tuán)隊(duì)對(duì)圖形數(shù)據(jù)庫(kù)技術(shù)的興趣日益濃厚,他們主要關(guān)注欺詐檢測(cè)、網(wǎng)絡(luò)安全、文本分析、數(shù)據(jù)目錄、數(shù)據(jù)管理以及科學(xué)研究等。

同時(shí),大數(shù)據(jù)的崛起也在促使更多用戶考慮圖形數(shù)據(jù)庫(kù)和圖形數(shù)據(jù)建模方法,Borne稱:“現(xiàn)在,圖形工具還有更多豐富的數(shù)據(jù)可供發(fā)現(xiàn)。”

例如,德國(guó)慕尼黑糖尿病研究中心數(shù)據(jù)和知識(shí)管理負(fù)責(zé)人Alexander Jarasch指出,Neo4j Inc.的同名圖形數(shù)據(jù)庫(kù)為他們提供了一個(gè)平臺(tái),可收集和分享各種基因數(shù)據(jù)和其他與糖尿病有關(guān)的信息。

Jarasch說(shuō),該中心以德語(yǔ)縮寫DZD被人們所熟知,該中心正在使用Neo4j努力為糖尿病患者創(chuàng)造新療法并找到預(yù)防該疾病的方法。他于2017年4月開始使用圖形數(shù)據(jù)庫(kù)進(jìn)行腳本編寫和原型設(shè)計(jì)工作,去年他的另外兩名團(tuán)隊(duì)成員也加入了這項(xiàng)工作。

圖形數(shù)據(jù)庫(kù)供應(yīng)商N(yùn)eo4j的Bloom數(shù)據(jù)探索軟件創(chuàng)建的可視化突出展現(xiàn)了公司、人員和城市之間的連接。

再見,數(shù)據(jù)連接

Jarasch從事生物信息學(xué)研究長(zhǎng)達(dá)10多年,他對(duì)關(guān)系型數(shù)據(jù)庫(kù)產(chǎn)生了厭惡,或者說(shuō)至少對(duì)數(shù)據(jù)連接產(chǎn)生厭惡,這通常是關(guān)系查詢的核心。他表示:“我討厭連接,當(dāng)你的數(shù)據(jù)分散在表格中,并試圖尋找見解時(shí),事情會(huì)變得很復(fù)雜。”

Jarasch和他的同事正在試圖使用Neo4j數(shù)據(jù)庫(kù)以便在DZD中更容易地共享各種數(shù)據(jù)。DZD由很多獨(dú)立的研究組織組成。根據(jù)Jarasch的說(shuō)法,這些數(shù)據(jù)來(lái)自醫(yī)院、實(shí)驗(yàn)室和其他來(lái)源。有些數(shù)據(jù)是關(guān)于人類的,還有的則是關(guān)于實(shí)驗(yàn)動(dòng)物。他指出:“每個(gè)人都有自己的數(shù)據(jù),他們交換數(shù)據(jù),但沒(méi)有任何主要方式來(lái)連接數(shù)據(jù)。”這就是他想通過(guò)圖形技術(shù)實(shí)現(xiàn)的目標(biāo)。

首先的步驟側(cè)重于創(chuàng)建與原始數(shù)據(jù)相關(guān)的元數(shù)據(jù),以便研究人員可看到可用于分析的內(nèi)容。隨后再使用圖形分析應(yīng)用程序。Jarasch表示,他預(yù)計(jì)今年可以為一兩個(gè)研究項(xiàng)目提供數(shù)據(jù),其中包括一個(gè)將人類匿名數(shù)據(jù)與小老鼠和豬數(shù)據(jù)關(guān)聯(lián)的項(xiàng)目。

盡管部署Neo4j,但Jarasch認(rèn)為在DZD仍然會(huì)需要使用關(guān)系數(shù)據(jù)庫(kù)。只是說(shuō),圖形數(shù)據(jù)庫(kù)軟件為研究科學(xué)家提供了“查看其數(shù)據(jù)的額外層”。

大量圖形選項(xiàng)

對(duì)于希望獲得圖形數(shù)據(jù)庫(kù)優(yōu)勢(shì)的其他用戶來(lái)說(shuō),市面上有各種技術(shù)選項(xiàng)。除Neo4j之外,原生圖形數(shù)據(jù)庫(kù)供應(yīng)商還包括Cambridge Semantics、Cray、Franz、Ontotext和TigerGraph。云平臺(tái)市場(chǎng)領(lǐng)導(dǎo)者AWS也提供圖形數(shù)據(jù)庫(kù),名為Amazon Neptune,該數(shù)據(jù)庫(kù)已于2017年底推出。

其他云提供商也有圖形技術(shù)。例如微軟的Azure Cosmos DB多模型數(shù)據(jù)庫(kù)可用于存儲(chǔ)和管理圖形數(shù)據(jù)。IBM通過(guò)名為Compose for JanusGraph的托管服務(wù)在其云端支持JanusGraph開源數(shù)據(jù)庫(kù)。

此外,甲骨文數(shù)據(jù)庫(kù)和Microsoft SQL Server等關(guān)系數(shù)據(jù)庫(kù)也可進(jìn)行圖形處理和分析。DataStax、MarkLogic、Redis等其他類型的NoSQL數(shù)據(jù)庫(kù)管理系統(tǒng)也支持圖形功能。同時(shí),Apache Spark分析引擎支持并行圖形計(jì)算。

歷史上來(lái)看,圖形數(shù)據(jù)庫(kù)分為兩類。除那些支持具有節(jié)點(diǎn)和邊緣的屬性圖形之外,還有RDF數(shù)據(jù)庫(kù),它是基于Resource Description Framework(資源描述框架),并且關(guān)注數(shù)據(jù)的語(yǔ)義方面,信息存儲(chǔ)在包含名詞、動(dòng)詞和對(duì)象的三元組中。但隨著供應(yīng)商開始支持這兩種類型,這種區(qū)別正在變得模糊。

通過(guò)圖形支持電網(wǎng)

劉光懿(Guangyi Liu,音譯)目前正在使用TigerGraph的大規(guī)模并行處理圖形數(shù)據(jù)庫(kù),以構(gòu)建可實(shí)時(shí)匹配電力供需的系統(tǒng)。

北美全球能源互聯(lián)研究所(GEIRINA)首席技術(shù)官劉光懿表示,在電力分配中部署實(shí)時(shí)分析性能一直是公用事業(yè)行業(yè)的夢(mèng)想。GEIRINA是位于加利福尼亞州圣何塞的研發(fā)中心,隸屬于中國(guó)國(guó)家電網(wǎng),這是一家位于北京的政府公用事業(yè)公司。

劉光懿的團(tuán)隊(duì)正在試圖在拓?fù)渖线M(jìn)行大規(guī)模線性方程處理,該拓?fù)浯韥?lái)自電網(wǎng)中數(shù)百萬(wàn)傳感器、執(zhí)行器、繼電器和開關(guān)的信號(hào)。該項(xiàng)目始于2015年,他們最初測(cè)試了甲骨文的關(guān)系數(shù)據(jù)庫(kù)軟件。但是像Jarasch一樣,劉發(fā)現(xiàn)了關(guān)系方法的缺點(diǎn)。

他表示:“對(duì)于甲骨文數(shù)據(jù)庫(kù),你需要將表格轉(zhuǎn)換為數(shù)據(jù)結(jié)構(gòu)—體現(xiàn)系統(tǒng)拓?fù)。然而,?duì)于TigerGraph,拓?fù)渚驮谀抢铩?rdquo;劉表示,圖形數(shù)據(jù)庫(kù)還可以并行運(yùn)行數(shù)據(jù)搜索和計(jì)算。

Bloor Research公司分析師Philip Howard表示,他預(yù)計(jì)圖形技術(shù)的應(yīng)用將繼續(xù)擴(kuò)大范圍。特別是對(duì)于很多現(xiàn)代應(yīng)用程序中大規(guī)模“誰(shuí)知道誰(shuí)?”問(wèn)題,他指出了圖形數(shù)據(jù)庫(kù)相對(duì)于關(guān)系型軟件的優(yōu)勢(shì)。

然而,圖形工具目前主要被用作關(guān)系數(shù)據(jù)庫(kù)或其他類型的NoSQL系統(tǒng)的附屬物。他指出,圖形可提供一種更自然的方式來(lái)建模和連接數(shù)據(jù),但在評(píng)估和選擇數(shù)據(jù)管理平臺(tái)時(shí),IT團(tuán)隊(duì)仍然傾向于“在表格內(nèi)”思考。

標(biāo)簽: 安全 大數(shù)據(jù) 谷歌 谷歌搜索引擎 腳本 排名 數(shù)據(jù)分析 數(shù)據(jù)庫(kù) 搜索 搜索引擎 網(wǎng)絡(luò) 網(wǎng)絡(luò)安全

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:數(shù)據(jù)科學(xué)太難?這些陷阱請(qǐng)避開,正能量很重要!

下一篇:2019年科技發(fā)展預(yù)測(cè):云、大數(shù)據(jù)、AI、物聯(lián)網(wǎng)和區(qū)塊鏈