中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

機(jī)器學(xué)習(xí)在高德起點(diǎn)抓路中的應(yīng)用實(shí)踐

2019-07-29    來(lái)源:raincent

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬(wàn)Linux鏡像隨意使用

1 導(dǎo)讀

數(shù)據(jù)對(duì)于地圖來(lái)說(shuō)十分重要,沒(méi)有數(shù)據(jù),就沒(méi)有地圖服務(wù)。用戶在使用地圖服務(wù)時(shí),不太會(huì)想到數(shù)據(jù)就像冰山一樣,用戶可見(jiàn)只是最直接、最顯性的產(chǎn)品功能部分,而支撐顯性部分所需要的根基,往往更龐大。

地圖數(shù)據(jù)最先是從專業(yè)采集來(lái)的,采集工具就是車、自行車、飛機(jī)和衛(wèi)星影像等,近兩年有了利用智能硬件的眾包采集。采集之后,就是把數(shù)據(jù)更新的速度和精準(zhǔn)度都無(wú)限提升。因?yàn)榈孛嫔献兓炝耍脩粼絹?lái)越依賴于地圖應(yīng)用。所以數(shù)據(jù)更新的速度和數(shù)據(jù)的準(zhǔn)確度就是在乎用戶體驗(yàn)的地圖公司的第一要?jiǎng)?wù)了。而數(shù)據(jù)更新的第一步,就是交通標(biāo)志檢測(cè)。

本文將主要介紹機(jī)器學(xué)習(xí)技術(shù)在高德的地圖數(shù)據(jù)生產(chǎn)的具體應(yīng)用,這些技術(shù)方案和設(shè)計(jì)都已經(jīng)過(guò)驗(yàn)證,取得了不錯(cuò)的效果,并且為高德地圖數(shù)據(jù)的快速更新提供了基礎(chǔ)的技術(shù)保證。

2 “交通標(biāo)志檢測(cè)”定義

交通標(biāo)志檢測(cè),特指在普通街景圖像上通過(guò)自動(dòng)化手段檢測(cè)出各種類型的交通標(biāo)志,如限速、禁止掉頭、人行橫道和電子眼等。這些檢測(cè)結(jié)果將作為生產(chǎn)數(shù)據(jù)交付給地圖數(shù)據(jù)制作流程,最終演變?yōu)榉⻊?wù)于廣大用戶的地圖數(shù)據(jù)。

3 難點(diǎn)與挑戰(zhàn)

交通標(biāo)志檢測(cè)的主要難點(diǎn)有樣式繁雜,且在拍攝過(guò)程中受自然環(huán)境的影響較大。此外,為滿足數(shù)據(jù)更新的速度和數(shù)據(jù)準(zhǔn)確度的要求,對(duì)于算法的性能要求也格外嚴(yán)格。

3.1 樣本形態(tài)差異大

交通標(biāo)志的形態(tài)差異主要體現(xiàn)在:

類型繁多:國(guó)標(biāo)定義的交通標(biāo)志有幾百個(gè)類型;

形狀多樣:常見(jiàn)交通標(biāo)志的形狀有三角形、圓形、方形、菱形、八邊形等,還有地面標(biāo)線、電子眼、信號(hào)燈,以及限高桿、柵欄等物理設(shè)施;

顏色分布廣泛:常見(jiàn)的有黃色、紅色、藍(lán)色、綠色、黑色、白色等;

圖像內(nèi)尺寸差異大:從幾百像素(如方牌、人行橫道等)到十幾像素(如電子眼)不均勻分布;

 

 

圖 1 常見(jiàn)道路交通標(biāo)志 (標(biāo)牌類)

3.2 自然場(chǎng)景下變化多端

在自然場(chǎng)景下,交通標(biāo)志存在樹(shù)木或車輛遮擋、磨損等情況;天氣、季節(jié)等也會(huì)影響到圖像采集過(guò)程中,造成圖像模糊、顏色失真等。

 

 

圖 2 自然場(chǎng)景下拍攝的交通標(biāo)志

一些外形與交通標(biāo)志相似的標(biāo)牌,如商戶的招牌、交通公益廣告牌等,對(duì)算法的準(zhǔn)確率造成極大的挑戰(zhàn)。

 

 

圖 3 類似交通標(biāo)志的噪聲示例

3.3 性能要求

準(zhǔn)召率:我們的應(yīng)用場(chǎng)景中對(duì)于召回率和準(zhǔn)確率的要求極高,任何未召回都會(huì)導(dǎo)致數(shù)據(jù)更新的延遲,而錯(cuò)召回則會(huì)影響作業(yè)效率與作業(yè)周期,最終對(duì)數(shù)據(jù)的快速更新造成影響;

吞吐量:高德每天需要處理上億張圖片,這就要求我們的算法不僅效果要好,處理速度也必須夠快,以免造成數(shù)據(jù)積壓,影響地圖數(shù)據(jù)的更新時(shí)效;

擴(kuò)展性:交通標(biāo)志的類型不是一成不變的 (國(guó)標(biāo)會(huì)存在調(diào)整,不同國(guó)家和地區(qū)之間各有特色),因此需要算法環(huán)節(jié)具有非常好的擴(kuò)展性,能夠快速適應(yīng)新增的各種交通標(biāo)志類型;

4 高德地圖中的交通標(biāo)志檢測(cè)方案

當(dāng)前學(xué)術(shù)界針對(duì)目標(biāo)檢測(cè)任務(wù)常用的深度學(xué)習(xí)模型一般都采用 End2End 的方式進(jìn)行訓(xùn)練,以得到全局最優(yōu)的檢測(cè)效果。這個(gè)方案在使用時(shí)非常簡(jiǎn)單,只需要標(biāo)注好“幾百類物體的樣本”,然后放到深度學(xué)習(xí)的框架里進(jìn)行迭代訓(xùn)練,就可以獲得最終模型,主要可以分為 Two Stage(FasterRCNN[1]) 和 One Stage(YOLO[2],SSD[3]) 兩大類。

但是在實(shí)際使用過(guò)程中,需要應(yīng)對(duì)如下問(wèn)題:

樣本標(biāo)注成本高:所有訓(xùn)練樣本都需要進(jìn)行全類別標(biāo)注,當(dāng)有新增類別時(shí)需要將歷史訓(xùn)練樣本全量補(bǔ)標(biāo),成本極高;

無(wú)法單類迭代:由于交通標(biāo)志出現(xiàn)的頻率和重要性不等,業(yè)務(wù)上對(duì)于部分類型 (如電子眼、限速牌等) 的準(zhǔn)召率要求更高。但是 End2End 的模型必須針對(duì)所有類型全量迭代,無(wú)法優(yōu)化單一類型,導(dǎo)致算法迭代和測(cè)試成本極高;

模型訓(xùn)練難度大:我們需要處理的交通標(biāo)志有幾百類,且各自出現(xiàn)頻率差異很大,使用單一目標(biāo)檢測(cè)模型完成如此巨大的分類任務(wù),模型訓(xùn)練難度太大,收斂緩慢,召回率、準(zhǔn)確率上難以平衡;

結(jié)合通用目標(biāo)檢測(cè)技術(shù)的發(fā)展以及高德地圖對(duì)于交通標(biāo)志檢測(cè)的需要,我們最終選擇了 Faster-RCNN 作為基礎(chǔ)檢測(cè)框架,它的檢測(cè)效果更好 (尤其是針對(duì)小目標(biāo)),獨(dú)立的 RPN 網(wǎng)路也可以滿足擴(kuò)展性要求。速度方面,我們也進(jìn)行了針對(duì)性的優(yōu)化調(diào)整。

在實(shí)際使用時(shí),我們將檢測(cè)框架分為目標(biāo)檢測(cè)與精細(xì)分類兩階段:

 

 

圖 4 交通標(biāo)志檢測(cè)的目標(biāo)檢測(cè)和精細(xì)分類階段

4.1 目標(biāo)檢測(cè)階段

目標(biāo)檢測(cè)階段的目的是通過(guò) Faster-RCNN 在圖片中檢測(cè)所有的交通標(biāo)志,并進(jìn)行粗分類,要求極高的召回率和執(zhí)行速度。在實(shí)際使用時(shí),我們采用了如下策略來(lái)提升算法能力:

效果方面:將檢測(cè)目標(biāo)根據(jù)外形特征分為 N 大類 (如圓形、三角形、方形,以及高寬比異常的人行橫道等),再為每一類配置專屬的 RPN 網(wǎng)絡(luò),各個(gè) RPN 根據(jù)對(duì)應(yīng)的尺寸特性設(shè)計(jì) Anchor 的 Ratio 和 Scale;不同 RPN 根據(jù)需要使用不同層的特征圖,設(shè)計(jì)更有針對(duì)性;

效果方面,針對(duì)各個(gè)類型樣本分布不均勻問(wèn)題,使用多種樣本增強(qiáng)手段,并在訓(xùn)練過(guò)程中使用 OHEM 等方式進(jìn)一步調(diào)整樣本分布;

效果方面,還借鑒了 IoU-Net、Soft-NMS 等方案,進(jìn)一步提升檢測(cè)效果;

性能方面,各個(gè)大類之間共享基礎(chǔ)卷積層,保證檢測(cè)時(shí)間不會(huì)過(guò)分增長(zhǎng);

擴(kuò)展性方面,對(duì)于新增類型,理想情況下只需要新增一個(gè) RPN 網(wǎng)絡(luò)單獨(dú)迭代,可以不對(duì)其他類型的效果造成任何影響 (如下圖,RPN1 和 RPN2 完全獨(dú)立);

 

 

圖 5 多 RPN 設(shè)計(jì)示意圖

4.2 精細(xì)分類階段

精細(xì)分類階段的目的是對(duì)目標(biāo)檢測(cè)階段得到候選框進(jìn)行精細(xì)分類并濾除噪聲,保證極高的召回率和準(zhǔn)確率。在實(shí)際實(shí)現(xiàn)中,還使用以下策略來(lái)提升效果:

為每個(gè)大類配置獨(dú)立的精細(xì)分類網(wǎng)絡(luò),互相之間不干擾;各個(gè)大類的迭代完全獨(dú)立和并行,可以多人并行研發(fā),有效縮短研發(fā)周期;

針對(duì)各個(gè)大類的難易程度,選擇不同計(jì)算復(fù)雜度的網(wǎng)絡(luò)來(lái)完成精細(xì)分類和噪聲抑制,避免因?yàn)槟承╊愋蛷?fù)雜度過(guò)高產(chǎn)生效率瓶頸;

樣本方面,各個(gè)大類可以獨(dú)立收集樣本,可以針對(duì)特定類型進(jìn)行收集和標(biāo)注,訓(xùn)練和測(cè)試集合的構(gòu)建效率大幅提升;

如下圖,針對(duì)圓形標(biāo)牌,其差異比較明確,可以使用簡(jiǎn)單網(wǎng)絡(luò);針對(duì)方牌,需要根據(jù)文字布局和內(nèi)容來(lái)區(qū)分正負(fù)樣本,分類難度大,因此必須使用較深的網(wǎng)絡(luò):

 

 

圖 6 精細(xì)分類模塊示意圖

由于同時(shí)使用了多個(gè)模型,上述方案會(huì)導(dǎo)致服務(wù)器的顯存占用顯著增加,對(duì)計(jì)算資源產(chǎn)生額外要求。針對(duì)該問(wèn)題,我們針對(duì)深度學(xué)習(xí)框架進(jìn)行優(yōu)化,動(dòng)態(tài)分配并在各模型間共享臨時(shí)緩沖區(qū),并裁剪框架的反向傳播功能,最終使得顯存占用降低 50% 以上。

5 效果與收益

上述方案已經(jīng)正式上線,準(zhǔn)召率都達(dá)到了生產(chǎn)作業(yè)的要求,日均圖片吞吐量在千萬(wàn)以上。以下是部分效果圖 (不同框代表不同檢測(cè)結(jié)果):

 

 

 

 

 

 

圖 7 交通標(biāo)志檢測(cè)效果圖

6 小結(jié)

交通標(biāo)志檢測(cè)技術(shù)已經(jīng)在高德地圖內(nèi)部得到應(yīng)用,有效提升了高德地圖的數(shù)據(jù)制作效率,達(dá)成地圖數(shù)據(jù)更新速度接近 T+0(時(shí)間差為零)的目標(biāo)。

目前我們也在把機(jī)器學(xué)習(xí)技術(shù)用于數(shù)據(jù)的自動(dòng)化制作,進(jìn)一步減少現(xiàn)實(shí)世界和地圖數(shù)據(jù)之間的差異,做到“連接真實(shí)世界,讓出行更美好”。

本文轉(zhuǎn)載自公眾號(hào)高德技術(shù)

原文鏈接:https://mp.weixin.qq.com/s/IJUMCOBhgXHv7VC1YT4q_g

標(biāo)簽: 地圖數(shù)據(jù) 機(jī)器學(xué)習(xí)技術(shù)

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:大數(shù)據(jù)的業(yè)務(wù)驅(qū)動(dòng)

下一篇:數(shù)據(jù)分析從業(yè)者必看,10 個(gè)加速Python數(shù)據(jù)分析的簡(jiǎn)單的小技巧