中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

機器學(xué)習(xí)在高德起點抓路中的應(yīng)用實踐

2019-07-29    來源:raincent

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

1 導(dǎo)讀

數(shù)據(jù)對于地圖來說十分重要,沒有數(shù)據(jù),就沒有地圖服務(wù)。用戶在使用地圖服務(wù)時,不太會想到數(shù)據(jù)就像冰山一樣,用戶可見只是最直接、最顯性的產(chǎn)品功能部分,而支撐顯性部分所需要的根基,往往更龐大。

地圖數(shù)據(jù)最先是從專業(yè)采集來的,采集工具就是車、自行車、飛機和衛(wèi)星影像等,近兩年有了利用智能硬件的眾包采集。采集之后,就是把數(shù)據(jù)更新的速度和精準(zhǔn)度都無限提升。因為地面上變化太快了,用戶越來越依賴于地圖應(yīng)用。所以數(shù)據(jù)更新的速度和數(shù)據(jù)的準(zhǔn)確度就是在乎用戶體驗的地圖公司的第一要務(wù)了。而數(shù)據(jù)更新的第一步,就是交通標(biāo)志檢測。

本文將主要介紹機器學(xué)習(xí)技術(shù)在高德的地圖數(shù)據(jù)生產(chǎn)的具體應(yīng)用,這些技術(shù)方案和設(shè)計都已經(jīng)過驗證,取得了不錯的效果,并且為高德地圖數(shù)據(jù)的快速更新提供了基礎(chǔ)的技術(shù)保證。

2 “交通標(biāo)志檢測”定義

交通標(biāo)志檢測,特指在普通街景圖像上通過自動化手段檢測出各種類型的交通標(biāo)志,如限速、禁止掉頭、人行橫道和電子眼等。這些檢測結(jié)果將作為生產(chǎn)數(shù)據(jù)交付給地圖數(shù)據(jù)制作流程,最終演變?yōu)榉⻊?wù)于廣大用戶的地圖數(shù)據(jù)。

3 難點與挑戰(zhàn)

交通標(biāo)志檢測的主要難點有樣式繁雜,且在拍攝過程中受自然環(huán)境的影響較大。此外,為滿足數(shù)據(jù)更新的速度和數(shù)據(jù)準(zhǔn)確度的要求,對于算法的性能要求也格外嚴(yán)格。

3.1 樣本形態(tài)差異大

交通標(biāo)志的形態(tài)差異主要體現(xiàn)在:

類型繁多:國標(biāo)定義的交通標(biāo)志有幾百個類型;

形狀多樣:常見交通標(biāo)志的形狀有三角形、圓形、方形、菱形、八邊形等,還有地面標(biāo)線、電子眼、信號燈,以及限高桿、柵欄等物理設(shè)施;

顏色分布廣泛:常見的有黃色、紅色、藍(lán)色、綠色、黑色、白色等;

圖像內(nèi)尺寸差異大:從幾百像素(如方牌、人行橫道等)到十幾像素(如電子眼)不均勻分布;

 

 

圖 1 常見道路交通標(biāo)志 (標(biāo)牌類)

3.2 自然場景下變化多端

在自然場景下,交通標(biāo)志存在樹木或車輛遮擋、磨損等情況;天氣、季節(jié)等也會影響到圖像采集過程中,造成圖像模糊、顏色失真等。

 

 

圖 2 自然場景下拍攝的交通標(biāo)志

一些外形與交通標(biāo)志相似的標(biāo)牌,如商戶的招牌、交通公益廣告牌等,對算法的準(zhǔn)確率造成極大的挑戰(zhàn)。

 

 

圖 3 類似交通標(biāo)志的噪聲示例

3.3 性能要求

準(zhǔn)召率:我們的應(yīng)用場景中對于召回率和準(zhǔn)確率的要求極高,任何未召回都會導(dǎo)致數(shù)據(jù)更新的延遲,而錯召回則會影響作業(yè)效率與作業(yè)周期,最終對數(shù)據(jù)的快速更新造成影響;

吞吐量:高德每天需要處理上億張圖片,這就要求我們的算法不僅效果要好,處理速度也必須夠快,以免造成數(shù)據(jù)積壓,影響地圖數(shù)據(jù)的更新時效;

擴展性:交通標(biāo)志的類型不是一成不變的 (國標(biāo)會存在調(diào)整,不同國家和地區(qū)之間各有特色),因此需要算法環(huán)節(jié)具有非常好的擴展性,能夠快速適應(yīng)新增的各種交通標(biāo)志類型;

4 高德地圖中的交通標(biāo)志檢測方案

當(dāng)前學(xué)術(shù)界針對目標(biāo)檢測任務(wù)常用的深度學(xué)習(xí)模型一般都采用 End2End 的方式進行訓(xùn)練,以得到全局最優(yōu)的檢測效果。這個方案在使用時非常簡單,只需要標(biāo)注好“幾百類物體的樣本”,然后放到深度學(xué)習(xí)的框架里進行迭代訓(xùn)練,就可以獲得最終模型,主要可以分為 Two Stage(FasterRCNN[1]) 和 One Stage(YOLO[2],SSD[3]) 兩大類。

但是在實際使用過程中,需要應(yīng)對如下問題:

樣本標(biāo)注成本高:所有訓(xùn)練樣本都需要進行全類別標(biāo)注,當(dāng)有新增類別時需要將歷史訓(xùn)練樣本全量補標(biāo),成本極高;

無法單類迭代:由于交通標(biāo)志出現(xiàn)的頻率和重要性不等,業(yè)務(wù)上對于部分類型 (如電子眼、限速牌等) 的準(zhǔn)召率要求更高。但是 End2End 的模型必須針對所有類型全量迭代,無法優(yōu)化單一類型,導(dǎo)致算法迭代和測試成本極高;

模型訓(xùn)練難度大:我們需要處理的交通標(biāo)志有幾百類,且各自出現(xiàn)頻率差異很大,使用單一目標(biāo)檢測模型完成如此巨大的分類任務(wù),模型訓(xùn)練難度太大,收斂緩慢,召回率、準(zhǔn)確率上難以平衡;

結(jié)合通用目標(biāo)檢測技術(shù)的發(fā)展以及高德地圖對于交通標(biāo)志檢測的需要,我們最終選擇了 Faster-RCNN 作為基礎(chǔ)檢測框架,它的檢測效果更好 (尤其是針對小目標(biāo)),獨立的 RPN 網(wǎng)路也可以滿足擴展性要求。速度方面,我們也進行了針對性的優(yōu)化調(diào)整。

在實際使用時,我們將檢測框架分為目標(biāo)檢測與精細(xì)分類兩階段:

 

 

圖 4 交通標(biāo)志檢測的目標(biāo)檢測和精細(xì)分類階段

4.1 目標(biāo)檢測階段

目標(biāo)檢測階段的目的是通過 Faster-RCNN 在圖片中檢測所有的交通標(biāo)志,并進行粗分類,要求極高的召回率和執(zhí)行速度。在實際使用時,我們采用了如下策略來提升算法能力:

效果方面:將檢測目標(biāo)根據(jù)外形特征分為 N 大類 (如圓形、三角形、方形,以及高寬比異常的人行橫道等),再為每一類配置專屬的 RPN 網(wǎng)絡(luò),各個 RPN 根據(jù)對應(yīng)的尺寸特性設(shè)計 Anchor 的 Ratio 和 Scale;不同 RPN 根據(jù)需要使用不同層的特征圖,設(shè)計更有針對性;

效果方面,針對各個類型樣本分布不均勻問題,使用多種樣本增強手段,并在訓(xùn)練過程中使用 OHEM 等方式進一步調(diào)整樣本分布;

效果方面,還借鑒了 IoU-Net、Soft-NMS 等方案,進一步提升檢測效果;

性能方面,各個大類之間共享基礎(chǔ)卷積層,保證檢測時間不會過分增長;

擴展性方面,對于新增類型,理想情況下只需要新增一個 RPN 網(wǎng)絡(luò)單獨迭代,可以不對其他類型的效果造成任何影響 (如下圖,RPN1 和 RPN2 完全獨立);

 

 

圖 5 多 RPN 設(shè)計示意圖

4.2 精細(xì)分類階段

精細(xì)分類階段的目的是對目標(biāo)檢測階段得到候選框進行精細(xì)分類并濾除噪聲,保證極高的召回率和準(zhǔn)確率。在實際實現(xiàn)中,還使用以下策略來提升效果:

為每個大類配置獨立的精細(xì)分類網(wǎng)絡(luò),互相之間不干擾;各個大類的迭代完全獨立和并行,可以多人并行研發(fā),有效縮短研發(fā)周期;

針對各個大類的難易程度,選擇不同計算復(fù)雜度的網(wǎng)絡(luò)來完成精細(xì)分類和噪聲抑制,避免因為某些類型復(fù)雜度過高產(chǎn)生效率瓶頸;

樣本方面,各個大類可以獨立收集樣本,可以針對特定類型進行收集和標(biāo)注,訓(xùn)練和測試集合的構(gòu)建效率大幅提升;

如下圖,針對圓形標(biāo)牌,其差異比較明確,可以使用簡單網(wǎng)絡(luò);針對方牌,需要根據(jù)文字布局和內(nèi)容來區(qū)分正負(fù)樣本,分類難度大,因此必須使用較深的網(wǎng)絡(luò):

 

 

圖 6 精細(xì)分類模塊示意圖

由于同時使用了多個模型,上述方案會導(dǎo)致服務(wù)器的顯存占用顯著增加,對計算資源產(chǎn)生額外要求。針對該問題,我們針對深度學(xué)習(xí)框架進行優(yōu)化,動態(tài)分配并在各模型間共享臨時緩沖區(qū),并裁剪框架的反向傳播功能,最終使得顯存占用降低 50% 以上。

5 效果與收益

上述方案已經(jīng)正式上線,準(zhǔn)召率都達(dá)到了生產(chǎn)作業(yè)的要求,日均圖片吞吐量在千萬以上。以下是部分效果圖 (不同框代表不同檢測結(jié)果):

 

 

 

 

 

 

圖 7 交通標(biāo)志檢測效果圖

6 小結(jié)

交通標(biāo)志檢測技術(shù)已經(jīng)在高德地圖內(nèi)部得到應(yīng)用,有效提升了高德地圖的數(shù)據(jù)制作效率,達(dá)成地圖數(shù)據(jù)更新速度接近 T+0(時間差為零)的目標(biāo)。

目前我們也在把機器學(xué)習(xí)技術(shù)用于數(shù)據(jù)的自動化制作,進一步減少現(xiàn)實世界和地圖數(shù)據(jù)之間的差異,做到“連接真實世界,讓出行更美好”。

本文轉(zhuǎn)載自公眾號高德技術(shù)

原文鏈接:https://mp.weixin.qq.com/s/IJUMCOBhgXHv7VC1YT4q_g

標(biāo)簽: 地圖數(shù)據(jù) 機器學(xué)習(xí)技術(shù)

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:大數(shù)據(jù)的業(yè)務(wù)驅(qū)動

下一篇:數(shù)據(jù)分析從業(yè)者必看,10 個加速Python數(shù)據(jù)分析的簡單的小技巧