中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

圖像數(shù)據(jù)增強(qiáng)方法一覽(附python代碼)

2018-09-27    來(lái)源:raincent

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬(wàn)Linux鏡像隨意使用

在圖像分類(lèi)任務(wù)中,圖像數(shù)據(jù)增強(qiáng)一般是大多數(shù)人會(huì)采用的方法之一,這是由于深度學(xué)習(xí)對(duì)數(shù)據(jù)集的大小有一定的要求,若原始的數(shù)據(jù)集比較小,無(wú)法很好地滿(mǎn)足網(wǎng)絡(luò)模型的訓(xùn)練,從而影響模型的性能,而圖像增強(qiáng)是對(duì)原始圖像進(jìn)行一定的處理以擴(kuò)充數(shù)據(jù)集,能夠在一定程度上提升模型的性能。

本文是我目前正在研究一項(xiàng)內(nèi)容,總結(jié)圖像數(shù)據(jù)增強(qiáng)的一些方法及其有效性。本研究的目的是學(xué)習(xí)如何增加訓(xùn)練數(shù)據(jù)集的大小,通過(guò)有限或少量數(shù)據(jù)來(lái)訓(xùn)練獲得具有魯棒性的卷積網(wǎng)絡(luò)模型。

這項(xiàng)研究要求列出我們可以想到的所有圖像增強(qiáng)方法,并列舉出所有這些組合,以嘗試和改善圖像分類(lèi)模型的性能。那么,能夠想到的一些最簡(jiǎn)單的增強(qiáng)方法有翻轉(zhuǎn)、平移、旋轉(zhuǎn)、縮放,分離單個(gè)r、g、b三個(gè)顏色通道以及添加噪聲。更激動(dòng)人心的增強(qiáng)方法是比較熱門(mén)的使用生成對(duì)抗網(wǎng)絡(luò)模型,有時(shí)交替使用遺傳算法和生成對(duì)抗網(wǎng)絡(luò)。此外,還提出了一些創(chuàng)造性方法,例如將類(lèi)似于Instagram中的高亮濾鏡應(yīng)用于圖像、應(yīng)用隨機(jī)區(qū)域銳化濾鏡,以及基于聚類(lèi)技術(shù)添加平均圖像等。本文將展示如何使用NumPy對(duì)圖像進(jìn)行擴(kuò)充。

下面是上述提到的增強(qiáng)技術(shù)的總結(jié)及說(shuō)明,如果你能想到其它任何方法來(lái)增強(qiáng)圖像,并可以提高圖像分類(lèi)器的性能,請(qǐng)?jiān)诹粞詤^(qū)評(píng)論。

 

 

原始圖像

增強(qiáng)

所有的數(shù)據(jù)增強(qiáng)都是在沒(méi)有OpenCV庫(kù)的情況下,使用Numpy完成。

 

 

翻轉(zhuǎn)|Flipping

對(duì)圖像進(jìn)行翻轉(zhuǎn)是最流行的圖像數(shù)據(jù)增強(qiáng)方法之一。這主要是由于翻轉(zhuǎn)圖像操作的代碼簡(jiǎn)單,以及對(duì)于大多數(shù)問(wèn)題而言,對(duì)圖像進(jìn)行翻轉(zhuǎn)操作能夠提升模型的性能。下面的模型可以被認(rèn)為是看到左鞋而不是右鞋,因此通過(guò)這種數(shù)據(jù)增加,模型對(duì)于看到鞋的潛在變化會(huì)變得更加魯棒。

 

 

 

 

平移|Translations

很容易想象對(duì)完成檢測(cè)任務(wù)的分類(lèi)器進(jìn)行平移增強(qiáng)能夠提升其性能,好像這個(gè)分類(lèi)模型試圖檢測(cè)鞋子何時(shí)在圖像中而不是是否在圖像中。這些平移操作將有助于它在無(wú)法看清整個(gè)鞋子的情況下認(rèn)出鞋子來(lái)。

 

左移

 

 

 

 

 

右移

 

 

 

 

上移

 

 

 

 

下移

 

 

加噪|Noise

對(duì)圖像加噪音是一種有趣的圖像增強(qiáng)技術(shù),現(xiàn)在我開(kāi)始對(duì)這類(lèi)操作變得更加熟悉。我已經(jīng)看過(guò)很多關(guān)于對(duì)抗網(wǎng)絡(luò)訓(xùn)練的有趣論文,當(dāng)將一些噪音加入到圖像后,模型無(wú)法對(duì)圖像進(jìn)行正確分類(lèi)。我仍然在尋找能產(chǎn)生比下圖更好的加噪方法。添加噪聲可能有助于使得畸變更加明顯,并使得模型更加魯棒。

 

 

加噪

 

 

生成對(duì)抗網(wǎng)絡(luò)|GAN:

我閱讀了很多關(guān)于生成對(duì)抗網(wǎng)絡(luò)的文獻(xiàn),文獻(xiàn)中很多都使用生成對(duì)抗網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)增強(qiáng),我對(duì)此也比較感興趣,下面是我使用MNIST數(shù)據(jù)集生成的一些圖像。

 

 

GAN生成圖像

正如我們從上圖中看到的,它們確實(shí)看起來(lái)像數(shù)字3、7和9,但實(shí)際上,將其送進(jìn)數(shù)字手寫(xiě)體分類(lèi)器中,它們并不能被識(shí)別為對(duì)應(yīng)的數(shù)字。

感謝你閱讀本文,希望你現(xiàn)在知道如何實(shí)現(xiàn)對(duì)基本數(shù)據(jù)進(jìn)行擴(kuò)充,以改進(jìn)自己搭建的分類(lèi)模型!

Connor Shorten,對(duì)深度學(xué)習(xí)、算法理論和生物信息學(xué)感興趣

文章原標(biāo)題《Image Augmentation Examples in Python》,譯者:海棠

標(biāo)簽: 代碼 網(wǎng)絡(luò)

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:工信部公示2018年大數(shù)據(jù)產(chǎn)業(yè)發(fā)展試點(diǎn)示范項(xiàng)目(附名單)

下一篇:對(duì)話星展銀行首席分析官:傳統(tǒng)銀行數(shù)據(jù)團(tuán)隊(duì)建設(shè)需要“翻譯”