中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

2019 年關(guān)于數(shù)據(jù)科學(xué)、機器學(xué)習(xí)和人工智能的五大預(yù)測

2019-01-30    來源:raincent

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

每年的這個時候,我們都會回顧過去,展望未來。對于數(shù)據(jù)科學(xué)、機器學(xué)習(xí)和人工智能來說,則是看看什么趨勢會加快、什么事情會真正發(fā)生、什么事情在未來一年不會發(fā)生。

我們一整年都在觀察和報道這些趨勢,并且我們搜索了網(wǎng)絡(luò),咨詢了我們的一些專家以了解其他人的想法。

以下是我們對去年預(yù)測的快速回顧。

我們曾預(yù)測:模型制作和數(shù)據(jù)準(zhǔn)備都將變得越來越自動化。更大的數(shù)據(jù)科學(xué)操作將匯集到單個平臺上(有很多可用的平臺)。這兩個趨勢都是對追求效率和效益的響應(yīng)。簡而言之,就是少數(shù)幾名數(shù)據(jù)科學(xué)家可以做許多科學(xué)家的工作。

預(yù)測正確。無代碼數(shù)據(jù)科學(xué)正在崛起,高級分析平臺中端到端的集成也是如此。

我們曾預(yù)測:數(shù)據(jù)科學(xué)將越來越專業(yè)化,這意味著神話般的“全棧”數(shù)據(jù)科學(xué)家將消失。

預(yù)測正確。現(xiàn)在談?wù)摳嗟氖菙?shù)據(jù)工程師而非數(shù)據(jù)科學(xué)家。數(shù)據(jù)工程師是讓數(shù)據(jù)科學(xué)模型在現(xiàn)實世界中工作的那些人。

我們曾預(yù)測:非數(shù)據(jù)科學(xué)家將比數(shù)據(jù)科學(xué)家做更多相當(dāng)復(fù)雜的分析工作。

預(yù)測正確。數(shù)據(jù)可視化和可視化分析技術(shù)的流行,讓非數(shù)據(jù)科學(xué)家可以從復(fù)雜的數(shù)據(jù)科學(xué)工具中獲取更多價值。

我們曾預(yù)測:深度學(xué)習(xí)是復(fù)雜且艱難的。沒有很多數(shù)據(jù)科學(xué)家專長于此領(lǐng)域,這將阻礙人工智能的應(yīng)用,直到深度學(xué)習(xí)平臺明顯地得到簡化和產(chǎn)品化。

微軟和谷歌都于 2018 年推出了自動化深度學(xué)習(xí)平臺。這些平臺都是從遷移學(xué)習(xí)開始,但在向著全面 AutoDL 的方向發(fā)展。還有一些整合了 AutoDL 平臺的初創(chuàng)企業(yè)。今年早些時候,我們考察了具有全面 AutoML 和 AutoDL 平臺的OneClick.AI。Gartner 最近提名DimensionalMechanics為具有 AutoDL 平臺的“5 大酷公司”之一。

我們曾預(yù)測:盡管有炒作,但人工智能和深度學(xué)習(xí)在更廣闊市場的滲入比我們想象的更有限而且速度也更慢。

除了聊天機器人的出現(xiàn),真正的人工智能在企業(yè)中的應(yīng)用是有限的。它們在實現(xiàn)的路上,但還未完成。我所見過的最全面的研究表明,只有 1/5 或 1/3 的大型企業(yè)在“大規(guī)模”地實施人工智能,這意味著他們在實施全場緊逼戰(zhàn)術(shù),給對手以最大的壓力。在規(guī)模小一點的公司中,這樣的公司所占的比例要小得多。我們也不能真正確定它們是否意味著“真正的”人工智能。

我們曾預(yù)測:公眾(和政府)將會認(rèn)真看待人工智能對社交和隱私的影響,包括有意和無意的影響。

只要看看新聞和報道,那些頂級社交媒體的高管們被政府和歐盟召喚去參加聽證會。開始看起來像游街示眾。政府將開始監(jiān)管,如果不在聯(lián)邦政府層面,那么會更加混亂,每個州各行其是,如即將生效的加州隱私規(guī)定或澳洲的強制性反加密要求。

因此,我們?nèi)ツ甑?6 個預(yù)測都實現(xiàn)了。盡管去年的很多預(yù)測對明年來說也有效,但是,我們打算做得更具體些。

以下是我們對 2019 年的趨勢預(yù)測。

預(yù)測 1:數(shù)據(jù)變得比算法更重要

無論是在深度學(xué)習(xí)還是在經(jīng)典機器學(xué)習(xí)領(lǐng)域,我們已經(jīng)有 1 年多時間沒有取得任何重大突破。有一些漸進的改進,比如,利用時間卷積網(wǎng)絡(luò)(Temporal Convolutional Nets,簡稱 TCN)而不是 RNN 來減少 NLP 中的延遲,但是沒有重大創(chuàng)新。性能最好的算法都是眾所周知的算法,或者利用自動機器學(xué)習(xí)很容易發(fā)現(xiàn)。

隨著各個企業(yè)踏上數(shù)字化轉(zhuǎn)型之旅,擁有更多更好的數(shù)據(jù)是成功的關(guān)鍵,而我們正處于這樣的時期。實際上,這給向不同方向發(fā)展的數(shù)據(jù)相關(guān)的解決方案提供了競爭機會。

一方面,獲取準(zhǔn)確標(biāo)記的圖像或文本訓(xùn)練數(shù)據(jù)仍然相當(dāng)昂貴和耗時。像 Figure Eight 這樣專注于標(biāo)記數(shù)據(jù)的公司正在推廣智能成本效益策略,如:主動學(xué)習(xí),它讓客戶決定標(biāo)記數(shù)據(jù)和模型準(zhǔn)確性之間的最佳權(quán)衡。這涉及添加人工標(biāo)記或機器標(biāo)記數(shù)據(jù),然后重新訓(xùn)練,通過多次迭代以找到最佳權(quán)衡。

另一方面是對第三方數(shù)據(jù)的訪問。像 DymstData 這樣的服務(wù)公司已經(jīng)進入了該領(lǐng)域,作為數(shù)百種附加數(shù)據(jù)的結(jié)算機構(gòu)。他們還承擔(dān)著保護敏感 PII 這個任務(wù)繁重的角色,其用戶能夠基于角色以訪問在金融和健康服務(wù)領(lǐng)域特別重要的敏感信息。

第三個方面是自動跟蹤和記錄模型中所用的數(shù)據(jù)源。特別地,當(dāng)集成來自很多數(shù)據(jù)源并隨著時間而變化的流數(shù)據(jù)時,了解數(shù)據(jù)的來源以及如何使用數(shù)據(jù),對準(zhǔn)確性和合規(guī)性都至關(guān)重要。Tibco 和其他一些分析平臺正在引入這個功能。

圍繞數(shù)據(jù)的服務(wù)產(chǎn)品今年今年有望大幅增長。

預(yù)測 2:隨著人工智能 / 機器學(xué)習(xí)從分析平臺轉(zhuǎn)移到特定于行業(yè)或流程的應(yīng)用程序,一切都將變得更容易。

縱觀人工智能 / 機器學(xué)習(xí)初創(chuàng)企業(yè)的世界,就能看出競爭正在轉(zhuǎn)向特定于行業(yè)或流程的應(yīng)用程序。這些應(yīng)用程序或迷你平臺專注于解決行業(yè)中特定的業(yè)務(wù)問題,如市場營銷、B2B 銷售、醫(yī)療保健、金融科技以及其他大約十幾個已經(jīng)明確定義的領(lǐng)域。要想有一個快速地了解,請參考下圖(CB Insights 年度人工智能 100 家優(yōu)勝者)以及他們按行業(yè)或流程進行分類的方式。

 

 

這些新的應(yīng)用程序?qū)W⒂谇度胧饺斯ぶ悄?/ 機器學(xué)習(xí),因此,用戶所在的組織就不需要一大組內(nèi)部數(shù)據(jù)科學(xué)家的支持,并且可以依賴這些開發(fā)人員繼續(xù)提供更新和改進。

有些人把這稱為人工智能 / 機器學(xué)習(xí)的商品化,但是,把它們稱為人工智能 / 機器學(xué)習(xí)的專業(yè)化更準(zhǔn)確。

如果你一直從事類似的工作,那么你可能還記得 90 年代后期從再造工程(Reengineering)到 ERP 的轉(zhuǎn)變,現(xiàn)在的情況和當(dāng)時非常相似。最初,再造工程要求企業(yè)用復(fù)雜的定制 IT 解決方案來改進流程,因為當(dāng)時不存在標(biāo)準(zhǔn)解決方案。這迅速促成了大型綜合性 ERP 興起,其中包括甲骨文、PeopleSoft、SAP 和其他一些公司,也為像 CRM 這樣的專業(yè)應(yīng)用程序打開了大門。我們的行業(yè)目前正在經(jīng)歷同樣的變化。

這些新供應(yīng)商都致力于在他們特定的利基市場提供廣泛的解決方案,但是最終會少于大而全的 ERP 規(guī)模的平臺?纯催@些行業(yè)分類中開發(fā)商的整合浪潮吧。

還要注意在中小型企業(yè)中人工智能 / 機器學(xué)習(xí)采用的加速情況,這些企業(yè)不再必須擁有大型數(shù)據(jù)科學(xué)家團隊,或者完全依賴定制開發(fā)的模型。

預(yù)測 3:數(shù)據(jù)工程師和數(shù)據(jù)分析師的興起

這個世界并沒有拋棄數(shù)據(jù)科學(xué)家。還遠遠沒有。但是,當(dāng)缺乏擁有某種技能的人才時,市場會用另外的方式來填補,以減輕由此帶來的痛苦。

其中一種方式是通過我們前面討論過的特定于行業(yè)和流程的智能應(yīng)用程序來解決問題,這些應(yīng)用程序不需要大量的內(nèi)部數(shù)據(jù)科學(xué)家。

第二個就是所有主流分析平臺正在做的事和快速涌現(xiàn)的數(shù)十個自動機器學(xué)習(xí)(AML)平臺。那就是在數(shù)據(jù)科學(xué)中更有效率,也就是說,只需要較少的數(shù)據(jù)科學(xué)家就可以做很多工作。

由于模型的數(shù)量沒有減少,事實上是在增加,這就把工作負荷轉(zhuǎn)移到了數(shù)據(jù)工程師身上,他們主要做兩件事情。

首先,他們要能夠創(chuàng)建數(shù)據(jù)科學(xué)所需的基礎(chǔ)設(shè)施,如數(shù)據(jù)湖或 Spark 實例。

其次,他們拿到那些模型并在業(yè)務(wù)系統(tǒng)中實現(xiàn)它們,同時跟蹤準(zhǔn)確性并進行模型更新。

有些數(shù)據(jù)工程師還負責(zé)數(shù)據(jù)操作,以提供干凈整潔并經(jīng)過預(yù)處理的數(shù)據(jù)流。

分析平臺的另一個演進是可視化分析和數(shù)據(jù)可視化工具的增長。這些工具現(xiàn)在大多數(shù)和數(shù)據(jù)科學(xué)工具集完全集成到一起,并允許數(shù)據(jù)分析師和 LOB 經(jīng)理提取更多價值,甚至指導(dǎo)分析工作。它們不會取代數(shù)據(jù)科學(xué)家。它強化了團隊方面正在形成的高級分析。

預(yù)測 4:神經(jīng)晶片:人工智能來到物聯(lián)網(wǎng)邊緣

有兩種不同的技術(shù)正在同時達到半成熟狀態(tài),它們可以解決一個長期存在的問題。這個問題就是延遲問題。

考慮一下這個例子,當(dāng)你想用移動設(shè)備自動把文本或圖像中的外文翻譯成英語時,你的設(shè)備實際上是把這些信號發(fā)回到在云上運行的應(yīng)用程序,翻譯工作是在那里進行的,然后把譯文發(fā)送回你的設(shè)備。

谷歌和其他提供即時翻譯服務(wù)的公司已經(jīng)從 RNN 轉(zhuǎn)換到稱為時間卷積網(wǎng)絡(luò)的專用 CNN 結(jié)構(gòu),原因是 RNN 不能很好地適應(yīng) MPP,但 CNN 可以。這種轉(zhuǎn)換減少了延遲,但是信號仍然需要完成整個往返。

解決該問題的兩種技術(shù)中的第 1 種是 5G 網(wǎng)絡(luò)。你可能知道 5G 速度更快,但其真正的優(yōu)點是其可以承載的流量密度。這真正打開了讓你生活中的一切在互聯(lián)網(wǎng)上傳播的大門。這其中有多少是值得的還有待于觀察。

第 2 種解決方案是引入更好的新型神經(jīng)晶片(又稱 spiking neural networks,脈沖神經(jīng)網(wǎng)絡(luò))。我們希望這些全新的神經(jīng)網(wǎng)絡(luò)架構(gòu)可以成為實現(xiàn)人工通用智能(Artificial General Intelligence,簡稱 AGI)的途徑。這還有很長的路要走。但是,主要的芯片制造商和一些初創(chuàng)企業(yè)正在發(fā)布脈沖神經(jīng)晶片,專門針對芯片上 CNN 和 RNN 類模型進行了優(yōu)化(沒有信號往返)。其中一些還為了獲得極低的能耗進行了優(yōu)化。

 

image

 

這些功能放在一起,很適合把深度學(xué)習(xí)轉(zhuǎn)移到真正位于網(wǎng)絡(luò)邊緣的芯片上。借助這些新功能,物聯(lián)網(wǎng)和其他流數(shù)據(jù)應(yīng)用程序有望在今年開始爆發(fā)。

預(yù)測 5:不同的人工智能框架之間開始交互

現(xiàn)在,文本、語音、圖像和視頻模型正在成為主流,我們碰到了意想不到的障礙。在一個框架(Caffe2、PyTorch、Apache MXNet、微軟 Cognitive Toolkit 和 TensorFlow)上構(gòu)建的模型無法輕松地移植到不同的框架。我們可以翻譯語音,但我們用的是名副其實的巴別塔。

幸運的是,這樣的痛點推動了創(chuàng)新。AWS、臉書和微軟合作構(gòu)建了開放式神經(jīng)網(wǎng)絡(luò)交換(Open Neural Network Exchange,簡稱 ONNX),使模型可在不同的框架上互操作。

隨著在開發(fā)人員、應(yīng)用程序和設(shè)備之間共享的模型的數(shù)量變得越來越多,ONNX 正在成為未來一年的關(guān)鍵技術(shù)。

這就是今年的情況。請繼續(xù)關(guān)注我們,明年來看看我們今年的預(yù)測準(zhǔn)不準(zhǔn)。

作者簡介

Bill 是 Data Science Central 的編輯總監(jiān)。他還是 Data-Magnum 的總裁兼首席數(shù)據(jù)科學(xué)家。自 2001 年以來,他一直從事數(shù)據(jù)科學(xué)家的工作。請通過 Bill@DataScienceCentral.com 或 Bill@Data-Magnum.com 和他聯(lián)系。

閱讀英文原文:5 Predictions about Data Science, Machine Learning, and AI for 2019,https://www.datasciencecentral.com/profiles/blogs/5-predictions-about-data-science-machine-learning-and-ai-for-2019

標(biāo)簽: b2b 代碼 谷歌 互聯(lián)網(wǎng) 金融 媒體 數(shù)據(jù)分析 搜索 推廣 網(wǎng)絡(luò) 轉(zhuǎn)型

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:pandas指南:做更高效的數(shù)據(jù)科學(xué)家

下一篇:機器學(xué)習(xí)數(shù)據(jù)集哪里找:最佳數(shù)據(jù)集來源盤點