中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

百度大腦 3.0作為集大成者有何亮點?百度AI技術與能力一覽

2018-07-05    來源:raincent

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用
百度大腦 3.0 技術與能力一覽。

7 月 4 日,一年一度的百度 AI 開發(fā)者大會在京如期舉行。

大會現(xiàn)場,百度不僅分享了公司在 AI技術、產(chǎn)品與平臺等方面的研究成果與最新進展,還宣布了百度大腦的重磅升級,3.0 版本正式問世。

為此,百度高級副總裁、AI 技術平臺體系(AIG)總負責人王海峰親自站臺對其展開了詳細的解讀。

 

 

「百度大腦 3.0 可以說是百度 AI 技術的集大成者。」王海峰如是說。

眾所周知,百度在 AI 技術上有著長期的投入和積累。在回顧百度 AI 技術的發(fā)展歷程時,王海峰提到了三個重要的時間節(jié)點。

2000 年,也就是十八年前,百度作為一家搜索公司誕生。由于搜索引擎背后除了互聯(lián)網(wǎng)技術的支持,也離不開自然語言處理、信息檢索等 AI 技術,因此在王海峰看來,百度從誕生的那一天起就開始了 AI 技術的研發(fā)與應用。

而在八年前的 2010 年,百度開始全面布局 AI 技術,先后開展了自然語言處理、計算機視覺、機器學習、數(shù)據(jù)挖掘、知識圖譜等 AI 技術的研發(fā)。

兩年后,百度開始著手深度學習技術的研發(fā)與應用,并在當年的百度圖像語音等應用中正式上線。

鑒于深度學習技術在實際應用中的驚艷表現(xiàn),百度在 2013 年成立了世界上第一個深度學習研究院,同時將深度學習技術率先應用于大規(guī)模線上搜索引擎之中,并于 2015 年上線了基于神經(jīng)網(wǎng)絡的機器翻譯系統(tǒng)。

經(jīng)過了十六年的積累,百度的 AI 技術日漸成熟。在此基礎上,百度于 2016 年正式發(fā)布百度大腦 1.0,不僅供百度內(nèi)部使用,還向開發(fā)者開放。

當時 1.0 版本的百度大腦在完成了基礎能力的搭建之后,僅僅實現(xiàn)了語音、圖像、用戶畫像和 PaddlePaddle 深度學習框架等核心技術的初步開放。

 

 

百度大腦基礎架構(gòu)

而伴隨著時間的推移,百度大腦也逐漸塑造成型。

去年開發(fā)者大會發(fā)布的百度大腦 2.0 已經(jīng)形成了完整的 AI 技術體系,向開發(fā)者開放的能力也超過了 60 項能力,既有各方面 AI 核心技術,也有場景化能力及解決方案。

而此次發(fā)布的百度大腦 3.0 在開放的能力數(shù)量方面又有了新的提升——已經(jīng)超過 110 項。

王海峰表示,今早他看到的最新數(shù)字是 117 項。

而在能力數(shù)量增加的同時,百度的 AI 技術能力也在不斷增強。王海峰介紹,此次百度大腦 3.0 的最核心技術,用一句話概括,就是多模態(tài)深度語義理解。

具體而言,就是對文字、聲音、圖片、視頻等多模態(tài)的數(shù)據(jù)和信息進行深層次多維度的語義理解,包括數(shù)據(jù)語義、知識語義、視覺語義、語音語義一體化和自然語言語義等多方面的語義理解技術。

換句話說,就是不僅要讓機器可以聽清、看清,還要能夠深入理解其背后的含義,從而更好地支撐各種應用。

 

 

百度大腦 3.0 核心技術——多模態(tài)深度語義理解

在 AI 領域,數(shù)據(jù)的重要性自不用提。無論是物理世界、人類社會還是網(wǎng)絡空間,都充斥著海量的多元、異構(gòu)、多模態(tài)的三元空間大數(shù)據(jù)。

那么如何最大程度發(fā)揮這些數(shù)據(jù)的價值呢?

這就需要對數(shù)據(jù)進行加工、處理、挖掘和分析,實現(xiàn)數(shù)據(jù)的語義化進而加以利用。

為此,百度通過統(tǒng)一表征、關聯(lián)計算,構(gòu)建包含千億節(jié)點、萬億關系的龐大數(shù)據(jù)語義網(wǎng)絡,并在此基礎上總結(jié)規(guī)律、提煉知識,進而助力經(jīng)濟和社會的發(fā)展。

王海峰舉了一個新能源充電樁智能運維的例子。

結(jié)合百度的大數(shù)據(jù)、深度學習等技術,對充電樁設備數(shù)據(jù)進行采集、傳輸、存儲、分析,就可以實現(xiàn)設備監(jiān)測、故障診斷、預測性維保等,在提升效率的同時也大幅節(jié)約了成本。

 

 

當然,除了數(shù)據(jù),理解大千世界中的多元知識也是打磨 AI 技術中的重要一環(huán)。而要構(gòu)建出詳盡而完備的知識圖譜卻并非易事,需要巧妙理清繁雜的垂直領域知識、梳理其中的邏輯。

而在這件事上,百度所投入的資源與人力顯而易見,目前已經(jīng)構(gòu)建了包含數(shù)億實體、數(shù)千億級事實的龐大知識圖譜。

除了基礎的由實體、屬性、關系構(gòu)成的實體圖譜,百度還針對不同的應用場景和知識形態(tài),構(gòu)建了關注點圖譜、事件圖譜、多媒體圖譜、行業(yè)知識圖譜等多種圖譜。

「知識圖譜是人類進步的重要階梯。」王海峰解釋道,百度所掌握的這些知識是構(gòu)建百度大腦的重要基礎。

以世界杯相關的知識圖譜為例,實體圖譜可以看到熱門球隊、熱門球星、賽場、賽程和主題歌等信息;關注點圖譜可以體現(xiàn)用戶對于 C 羅和梅西的興趣所向;多媒體圖譜則包括圖片、音樂和視頻;行業(yè)圖譜和事件圖譜覆蓋了足球規(guī)則的各種知識和近 9 屆世界杯的大事件。

這些不同類型的圖譜通過關系關聯(lián)起來,也會延展出新的圖譜,構(gòu)成龐大的多元語義知識網(wǎng)絡。

大會現(xiàn)場,百度還播放了一段世界杯球賽視頻,展示了百度大腦的視覺語義理解能力。視頻中,系統(tǒng)不僅可以全面識別視頻中的球員、裁判、球、以及球門、球場線等人、物和場景,還可以捕捉射門、進球、角球、任意球、換人等事件。

基于這些結(jié)構(gòu)化語義信息,既可以完成機器人自動解說,也可以進行精彩片段集錦以及各種數(shù)據(jù)統(tǒng)計分析等。

 

 

百度大腦視覺語義能力在足球賽事中的展現(xiàn)

而在日常生活場景中,百度大腦的視覺語義理解能力也能夠發(fā)揮作用。

在無人超市購物場景下,系統(tǒng)可以通過攝像頭對超市中的人、貨、場進行全方位識別,然后將圖像信息進行時序化和結(jié)構(gòu)化,讓購物機器人能夠掌握環(huán)境信息進而完成自動避障并引導顧客行進,讓系統(tǒng)得以實時掌握顧客取拿的商品。

對于時下大熱的無人零售領域,這項技術無疑是一種必不可少的存在。

 

 

百度大腦視覺語義能力在無人超市場景中的展現(xiàn)

在為「眼睛」賦予了理解能力后,百度大腦自然不會放過人類最重要的交流媒介——語音和語言。

在語音技術方面,百度大腦在高噪聲環(huán)境 Hand-free 語音識別準確率上提升了 10 個百分點。與此同時,百度大腦采用語音語義一體化技術使得遠場語音識別準確率也提升了 10 個百分點。

而為了讓整個對話過程更加自然,百度大腦在語音的合成上采用拼接了 WaveNet+的情感語音合成技術,如此一來,既可以使得交互的流暢度大幅提升,又避免了計算量過大的問題。

目前,新版百度地圖中的小度語音助手已經(jīng)可以理解復雜的語義請求,面對「我要從三里屯的團結(jié)湖地鐵站出發(fā)、路過望京家樂福、然后再去南鑼鼓巷最后到我家,要紅綠燈少的、不堵車的最快路徑」這樣的請求也絲毫不懼。

王海峰介紹,在對話理解上,百度研發(fā)了最新的深層注意力匹配模型并將其引入到系統(tǒng)之中,比已知的最好結(jié)果提升了 4.1%。從優(yōu)化前后的結(jié)果來看,引入這種模型的對話交互的確更加自然。

 

 

而在閱讀理解上,百度大腦已經(jīng)閱讀了千億量級的文章,相當于 6 萬個中國國家圖書館的藏書,積累了億級實體、千億事實的知識。

以葡萄牙和西班牙的比賽為例,通過閱讀網(wǎng)上大量相關新聞,百度大腦不僅了解比賽的事件與主題,還能與用戶進行問答及推薦互動?梢园l(fā)現(xiàn),通過持續(xù)獲取和積累知識,百度大腦的智能水平得到了顯著提升。

 

 

而在百度大腦各項技術與能力升級的背后,是百度在底層技術上的不斷打磨與迭代,也離不開深度學習框架 PaddlePaddle 的支持。

 

 

2012 年,百度開始深度學習技術的研發(fā),并從 2013 年自主研發(fā)深度學習平臺,并讓其服務于百度的多項核心業(yè)務。

在 2016 年 9 月,百度對外發(fā)布了自己的深度學習框架 PaddlePaddle。一年后,百度發(fā)布新一代深度學習框架 PaddlePaddle Fluid。

而今,百度的深度學習框架再次實現(xiàn)升級。王海峰在大會現(xiàn)場發(fā)布了最新版本——PaddlePaddle 3.0。

據(jù)王海峰介紹,PaddlePaddle3.0 核心框架還包括三個重要平臺,分別為快速應用平臺 EasyDL、網(wǎng)絡結(jié)構(gòu)自動化設計 AutoDL 以及在線實訓平臺 AI Studio。

 

 

其中,EasyDL 平臺可以讓零基礎開發(fā)者迅速定制自己的應用,大幅降低了人們進入 AI 領域的門檻。

 

 

EasyDL 在制造業(yè)鍵盤組裝合格性檢測上的能力

而對于那些有基礎的開發(fā)者來說,設計深度學習網(wǎng)絡結(jié)構(gòu)是一項相對耗時耗力的工作,AutoDL 的存在就是致力于幫助開發(fā)者節(jié)省設計深度學習網(wǎng)絡結(jié)構(gòu)的時間。

 

 

人工設計的網(wǎng)絡結(jié)構(gòu)與 AutoDL 網(wǎng)絡設計效果比對

「我們不止是把核心算法做了升級,同時在服務器端以及移動端都有各自相應的服務可以支持各種場景的應用!雇鹾7逖a充道。

在談到深度學習框架與 AI 生態(tài)的關系時,王海峰認為深度學習框架可以類比為 AI 的操作系統(tǒng),向下可以與 AI 芯片結(jié)合。

要知道,AI 芯片在對 AI 模型的計算進行專門優(yōu)化后,性能會有很大的提升。從這個角度出發(fā),王海峰表示深度學習框架相當于 AI 芯片的指令集。

值得一提的是,此次大會百度還發(fā)布了一款云端全功能 AI 芯片「昆侖」,主打高性能、高性價比、易用三大特點。百度表示,其運算能力比最新基于 FPGA 的 AI 加速器,性能提升了近 30 倍。

當然,沒有經(jīng)過真實場景使用的技術都是紙上談兵,實踐與應用才是培育技術最佳土壤。王海峰透露,目前百度大腦每天的調(diào)用次數(shù)已經(jīng)超過了 4090 億次,調(diào)用的人既有 AI 工程師,也有零 AI 基礎的初入門者,還有來自各行各業(yè)希望用 AI 創(chuàng)新業(yè)務、為業(yè)務轉(zhuǎn)型升級的企業(yè)。

不難想象,這些龐大的開發(fā)者群將成為百度大腦迭代更新路上的最大助力。

「估計明年我們再站在這里的時候就需要更大的屏幕來展示百度大腦開放給開發(fā)者的能力了!雇鹾7蹇偨Y(jié)說,「我們更希望我們的能力可以幫助開發(fā)者獲得屬于自己的成功,這也是我們最大的心愿!

 

標簽: 大數(shù)據(jù) 服務器 服務器端 互聯(lián)網(wǎng) 互聯(lián)網(wǎng)技術 開發(fā)者 媒體 搜索 搜索引擎 網(wǎng)絡 轉(zhuǎn)型

版權申明:本站文章部分自網(wǎng)絡,如有侵權,請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:阿里云ET城市大腦「天擎」,1分鐘把16小時視頻譯成二進制語言

下一篇:Facebook、谷歌、微軟利用“黑暗模式”誘騙用戶交出數(shù)據(jù)