微網(wǎng)站怎么做的好網(wǎng)站優(yōu)化推廣公司
? ? ? ? 在機(jī)器學(xué)習(xí)中,絕大部分模型都需要大量的數(shù)據(jù)進(jìn)行訓(xùn)練和學(xué)習(xí)(包括有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)),然而在實(shí)際應(yīng)用中經(jīng)常會遇到訓(xùn)練數(shù)據(jù)不足的問題。就比如圖像分類這樣的計(jì)算機(jī)視覺任務(wù),確實(shí)依賴于大規(guī)模且多樣化的訓(xùn)練數(shù)據(jù)以確保模型能夠有效地泛化到未見過的實(shí)例上。然而,實(shí)踐中遭遇訓(xùn)練數(shù)據(jù)不足是很常見的挑戰(zhàn)。當(dāng)訓(xùn)練一個(gè)圖像分類模型時(shí),如果訓(xùn)練樣本比較少,該如何處理呢?
一、訓(xùn)練數(shù)據(jù)不足會造成什么問題?
(1)過擬合
????????圖像分類任務(wù)上,訓(xùn)練數(shù)據(jù)不足帶來的問題主要表現(xiàn)在過擬合方面。處理策略大致可以歸納為兩大類:
- 依賴模型的方法:其核心在于采取降低過擬合風(fēng)險(xiǎn)的策略。這包括簡化模型結(jié)構(gòu)(例如,將復(fù)雜的非線性模型簡化為更易處理的線性模型)、引入正則化項(xiàng)以縮小模型假設(shè)空間(如采用L1或L2正則化技術(shù))、運(yùn)用集成學(xué)習(xí)方法以及調(diào)整Dropout超參數(shù)等手段。
- 基于數(shù)據(jù)的方法:主要通過數(shù)據(jù)增強(qiáng)技術(shù)來實(shí)施。這類方法依據(jù)特定的先驗(yàn)知識,在保留關(guān)鍵信息的同時(shí)對原始數(shù)據(jù)進(jìn)行合適的轉(zhuǎn)換,旨在擴(kuò)展數(shù)據(jù)集并提高模型的泛化能力。
(2)欠擬合
????????在圖像分類任務(wù)上,訓(xùn)練數(shù)據(jù)不足也有可能帶來欠擬合的問題。欠擬合是指模型的復(fù)雜度不足以捕捉到數(shù)據(jù)集中的所有重要特征和模式,導(dǎo)致模型在訓(xùn)練集上的表現(xiàn)也不理想,更不用說在未見過的測試集上了。當(dāng)訓(xùn)練數(shù)據(jù)不足時(shí),模型可能無法從有限的樣本中學(xué)習(xí)到足夠的信息來概括整個(gè)數(shù)據(jù)分布,表現(xiàn)為模型的泛化能力較弱。
????????可以通過上面的兩種思路來嘗試緩解欠擬合:
- 依賴模型的方法:使用更大規(guī)?;蛘吒顚哟蔚纳窠?jīng)網(wǎng)絡(luò)結(jié)構(gòu),使模型具有更強(qiáng)的學(xué)習(xí)能力來捕捉數(shù)據(jù)中的復(fù)雜關(guān)系?;蚴褂眠w移學(xué)習(xí)、集成學(xué)習(xí)的方法。
- 基于數(shù)據(jù)的方法:數(shù)據(jù)增強(qiáng)技術(shù),對現(xiàn)有的少量訓(xùn)練數(shù)據(jù)進(jìn)行各種變換,例如旋轉(zhuǎn)、翻轉(zhuǎn)、裁剪、縮放、顏色抖動等,以模擬更多的訓(xùn)練樣本。
????????關(guān)于跟多過擬合與欠擬合的概念,可以看看我之前的文章:
【機(jī)器學(xué)習(xí)300問】27、高偏差與高方差是什么?他們對評估機(jī)器學(xué)習(xí)模型起何作用?http://t.csdnimg.cn/EalJu
二、如何解決數(shù)據(jù)不足帶來的問題?
? ? ? ? 這里有很多方法,我之前的文章已經(jīng)講過了,我在本文中拓展將一下圖像的數(shù)據(jù)增強(qiáng)技術(shù)。?
(1)遷移學(xué)習(xí)
?????????利用預(yù)訓(xùn)練的深度學(xué)習(xí)模型,保留其底層特征提取層,并在頂部添加新的全連接層或卷積層,僅用少量標(biāo)注圖像對該部分進(jìn)行微調(diào)。
【機(jī)器學(xué)習(xí)300問】37、什么是遷移學(xué)習(xí)?http://t.csdnimg.cn/Q7aQQ
(2)欠采樣/過采樣技術(shù)
?????????對于類別不平衡問題,可以通過欠采樣冗余類別或過采樣少數(shù)類別的方法來平衡數(shù)據(jù)分布。
【機(jī)器學(xué)習(xí)300問】31、不平衡數(shù)據(jù)集如何進(jìn)行機(jī)器學(xué)習(xí)?http://t.csdnimg.cn/f8SL8
(3)數(shù)據(jù)增強(qiáng)
????????通過對現(xiàn)有的圖像數(shù)據(jù)進(jìn)行各種變換,如翻轉(zhuǎn)、旋轉(zhuǎn)、裁剪、縮放、顏色抖動、平移等操作,生成新的訓(xùn)練樣本,從而擴(kuò)大訓(xùn)練集的大小而不引入額外的真實(shí)數(shù)據(jù)。
【機(jī)器學(xué)習(xí)300問】29、訓(xùn)練數(shù)據(jù)少該怎么辦?數(shù)據(jù)增強(qiáng)http://t.csdnimg.cn/uhLP5
① 色彩空間轉(zhuǎn)換
? ? ? ? 比如手勢識別中,如果圖像訓(xùn)練數(shù)據(jù)過少,可以采取顏色變換的方式增加圖像。圖像處理中常見的顏色空間分布有 RGB、HSV 和 YCrCb 三種空間模型。比較這三種空間模型后發(fā)現(xiàn) RGB 空間由于亮度信息存在三個(gè)顏色通道中,并不相互獨(dú)立,難以從 RGB 顏色空間中有效提取出手勢的膚色信息,而 YCrCb 和 HSV 顏色空間都具有亮度與色度相分離的特點(diǎn),并且膚色范圍緊密,不易受光照后其他物體的干擾,相對來說更適用提取手勢的膚色信息。RGB 與 YCrCb 空間轉(zhuǎn)化的計(jì)算公式如下所示。
????????這里的R、G、B代表原始RGB顏色空間中的紅色、綠色和藍(lán)色通道值,Y是計(jì)算出的亮度值,Cb和Cr是對應(yīng)于藍(lán)色和紅色的色度分量。公式中加上的128是為了將色度分量的取值范圍從-127至128調(diào)整到0至255的標(biāo)準(zhǔn)8位顏色值區(qū)間。通過這種轉(zhuǎn)換后,可以根據(jù)Cr和Cb的值來判斷像素是否屬于膚色區(qū)域。
② 二值化
????????圖像的二值化處理是將圖像上所有像素點(diǎn)的灰度值設(shè)置為 0 或者 255 過程,使得整個(gè)圖像呈現(xiàn)出明顯的黑白效果,通常選取一個(gè)合適的閾值,當(dāng)圖像中像素值大于或者等于閾值時(shí)判定為前景,將其值設(shè)為 255,反之則判定為背景,將其值設(shè)為 0。圖像的二值化使得圖像變得簡單明了,通過前景和背景的像素值重置可以有效降低背景噪聲,在一定程度增強(qiáng)了特征。
? ? ? ? 下面介紹一個(gè)常用的選取合適閾值的方法——最大類間方差法(也稱Otsu)。其基本思想是將圖像看做前景目標(biāo)和背景環(huán)境兩個(gè)部分組成,用兩部分像素值的方差來估計(jì)前景目標(biāo)和背景環(huán)境之間的差別,通過像素劃分各部分出現(xiàn)的概率和平均灰度級來計(jì)算兩部分的方差,得到使得前景目標(biāo)和環(huán)境背景的類間方差達(dá)到最大的灰度級值默認(rèn)為最佳閾值。最佳閾值的標(biāo)準(zhǔn)判別公式如下所示。
?
? ? ? ? 其中,是當(dāng)前的閾值。
和
分別是背景(閾值以下)和前景(閾值以上)的像素占比。
和
分別是背景和前景的像素平均灰度值。
表示類間方差,即背景與前景之間的差異。Otsu的方法就是通過遍歷全部可能的t值,找到最大化
的那個(gè)t值,即最佳閾值。在實(shí)踐中,最大類間方差法是一種高效且自動的閾值選擇方法,尤其在物體識別和圖像分割中被廣泛使用。