圖像數(shù)據(jù)增強(qiáng)方法一覽（附python代碼）

2018-09-27 來(lái)源：raincent

容器云強(qiáng)勢(shì)上線！快速搭建集群，上萬(wàn)Linux鏡像隨意使用

在圖像分類任務(wù)中，圖像數(shù)據(jù)增強(qiáng)一般是大多數(shù)人會(huì)采用的方法之一，這是由于深度學(xué)習(xí)對(duì)數(shù)據(jù)集的大小有一定的要求，若原始的數(shù)據(jù)集比較小，無(wú)法很好地滿足網(wǎng)絡(luò)模型的訓(xùn)練，從而影響模型的性能，而圖像增強(qiáng)是對(duì)原始圖像進(jìn)行一定的處理以擴(kuò)充數(shù)據(jù)集，能夠在一定程度上提升模型的性能。

本文是我目前正在研究一項(xiàng)內(nèi)容，總結(jié)圖像數(shù)據(jù)增強(qiáng)的一些方法及其有效性。本研究的目的是學(xué)習(xí)如何增加訓(xùn)練數(shù)據(jù)集的大小，通過(guò)有限或少量數(shù)據(jù)來(lái)訓(xùn)練獲得具有魯棒性的卷積網(wǎng)絡(luò)模型。

這項(xiàng)研究要求列出我們可以想到的所有圖像增強(qiáng)方法，并列舉出所有這些組合，以嘗試和改善圖像分類模型的性能。那么，能夠想到的一些最簡(jiǎn)單的增強(qiáng)方法有翻轉(zhuǎn)、平移、旋轉(zhuǎn)、縮放，分離單個(gè)r、g、b三個(gè)顏色通道以及添加噪聲。更激動(dòng)人心的增強(qiáng)方法是比較熱門的使用生成對(duì)抗網(wǎng)絡(luò)模型，有時(shí)交替使用遺傳算法和生成對(duì)抗網(wǎng)絡(luò)。此外，還提出了一些創(chuàng)造性方法，例如將類似于Instagram中的高亮濾鏡應(yīng)用于圖像、應(yīng)用隨機(jī)區(qū)域銳化濾鏡，以及基于聚類技術(shù)添加平均圖像等。本文將展示如何使用NumPy對(duì)圖像進(jìn)行擴(kuò)充。

下面是上述提到的增強(qiáng)技術(shù)的總結(jié)及說(shuō)明，如果你能想到其它任何方法來(lái)增強(qiáng)圖像，并可以提高圖像分類器的性能，請(qǐng)?jiān)诹粞詤^(qū)評(píng)論。

原始圖像

增強(qiáng)

所有的數(shù)據(jù)增強(qiáng)都是在沒(méi)有OpenCV庫(kù)的情況下，使用Numpy完成。

翻轉(zhuǎn)|Flipping

對(duì)圖像進(jìn)行翻轉(zhuǎn)是最流行的圖像數(shù)據(jù)增強(qiáng)方法之一。這主要是由于翻轉(zhuǎn)圖像操作的代碼簡(jiǎn)單，以及對(duì)于大多數(shù)問(wèn)題而言，對(duì)圖像進(jìn)行翻轉(zhuǎn)操作能夠提升模型的性能。下面的模型可以被認(rèn)為是看到左鞋而不是右鞋，因此通過(guò)這種數(shù)據(jù)增加，模型對(duì)于看到鞋的潛在變化會(huì)變得更加魯棒。

平移|Translations

很容易想象對(duì)完成檢測(cè)任務(wù)的分類器進(jìn)行平移增強(qiáng)能夠提升其性能，好像這個(gè)分類模型試圖檢測(cè)鞋子何時(shí)在圖像中而不是是否在圖像中。這些平移操作將有助于它在無(wú)法看清整個(gè)鞋子的情況下認(rèn)出鞋子來(lái)。

左移

右移

上移

下移

加噪|Noise

對(duì)圖像加噪音是一種有趣的圖像增強(qiáng)技術(shù)，現(xiàn)在我開始對(duì)這類操作變得更加熟悉。我已經(jīng)看過(guò)很多關(guān)于對(duì)抗網(wǎng)絡(luò)訓(xùn)練的有趣論文，當(dāng)將一些噪音加入到圖像后，模型無(wú)法對(duì)圖像進(jìn)行正確分類。我仍然在尋找能產(chǎn)生比下圖更好的加噪方法。添加噪聲可能有助于使得畸變更加明顯，并使得模型更加魯棒。

加噪

生成對(duì)抗網(wǎng)絡(luò)|GAN：

我閱讀了很多關(guān)于生成對(duì)抗網(wǎng)絡(luò)的文獻(xiàn)，文獻(xiàn)中很多都使用生成對(duì)抗網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)增強(qiáng)，我對(duì)此也比較感興趣，下面是我使用MNIST數(shù)據(jù)集生成的一些圖像。

GAN生成圖像

正如我們從上圖中看到的，它們確實(shí)看起來(lái)像數(shù)字3、7和9，但實(shí)際上，將其送進(jìn)數(shù)字手寫體分類器中，它們并不能被識(shí)別為對(duì)應(yīng)的數(shù)字。

感謝你閱讀本文，希望你現(xiàn)在知道如何實(shí)現(xiàn)對(duì)基本數(shù)據(jù)進(jìn)行擴(kuò)充，以改進(jìn)自己搭建的分類模型!

Connor Shorten，對(duì)深度學(xué)習(xí)、算法理論和生物信息學(xué)感興趣

文章原標(biāo)題《Image Augmentation Examples in Python》，譯者：海棠

標(biāo)簽：代碼網(wǎng)絡(luò)

版權(quán)申明：本站文章部分自網(wǎng)絡(luò)，如有侵權(quán)，請(qǐng)聯(lián)系：west999com@outlook.com
特別注意：本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)！
本站所提供的圖片等素材，版權(quán)歸原作者所有，如需使用，請(qǐng)與原作者聯(lián)系。

上一篇:工信部公示2018年大數(shù)據(jù)產(chǎn)業(yè)發(fā)展試點(diǎn)示范項(xiàng)目（附名單）

下一篇:對(duì)話星展銀行首席分析官：傳統(tǒng)銀行數(shù)據(jù)團(tuán)隊(duì)建設(shè)需要“翻譯”

相關(guān)文章

最新資訊

熱門推薦

為學(xué)習(xí)和知識(shí)分享目的，本站文章部分自網(wǎng)絡(luò)，本站文章部分自網(wǎng)絡(luò)，如有侵權(quán)，請(qǐng)聯(lián)系：2653426586@qq.com QQ：2653426586

如有其他需求，請(qǐng)聯(lián)系：2653426586@qq.com QQ：2653426586

友情鏈接：網(wǎng)絡(luò)安全運(yùn)維經(jīng)驗(yàn) IT技術(shù)分享運(yùn)維隨筆錄鮮花東郊到家往約到家

中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

圖像數(shù)據(jù)增強(qiáng)方法一覽（附python代碼）