當(dāng)前位置：首頁 > news >正文

微網(wǎng)站怎么做的好網(wǎng)站優(yōu)化推廣公司

news 2025/7/2 8:18:18

微網(wǎng)站怎么做的好,網(wǎng)站優(yōu)化推廣公司,汽貿(mào)公司網(wǎng)站建設(shè),wordpress 顯示圖片啊在機(jī)器學(xué)習(xí)中，絕大部分模型都需要大量的數(shù)據(jù)進(jìn)行訓(xùn)練和學(xué)習(xí)（包括有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)），然而在實(shí)際應(yīng)用中經(jīng)常會遇到訓(xùn)練數(shù)據(jù)不足的問題。就比如圖像分類這樣的計(jì)算機(jī)視覺任務(wù)，確實(shí)依賴于大規(guī)模且多樣化的訓(xùn)練數(shù)據(jù)以…

? ? ? ? 在機(jī)器學(xué)習(xí)中，絕大部分模型都需要大量的數(shù)據(jù)進(jìn)行訓(xùn)練和學(xué)習(xí)（包括有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)），然而在實(shí)際應(yīng)用中經(jīng)常會遇到訓(xùn)練數(shù)據(jù)不足的問題。就比如圖像分類這樣的計(jì)算機(jī)視覺任務(wù)，確實(shí)依賴于大規(guī)模且多樣化的訓(xùn)練數(shù)據(jù)以確保模型能夠有效地泛化到未見過的實(shí)例上。然而，實(shí)踐中遭遇訓(xùn)練數(shù)據(jù)不足是很常見的挑戰(zhàn)。當(dāng)訓(xùn)練一個(gè)圖像分類模型時(shí)，如果訓(xùn)練樣本比較少，該如何處理呢？

一、訓(xùn)練數(shù)據(jù)不足會造成什么問題？

（1）過擬合

????????圖像分類任務(wù)上，訓(xùn)練數(shù)據(jù)不足帶來的問題主要表現(xiàn)在過擬合方面。處理策略大致可以歸納為兩大類：

依賴模型的方法：其核心在于采取降低過擬合風(fēng)險(xiǎn)的策略。這包括簡化模型結(jié)構(gòu)（例如，將復(fù)雜的非線性模型簡化為更易處理的線性模型）、引入正則化項(xiàng)以縮小模型假設(shè)空間（如采用L1或L2正則化技術(shù)）、運(yùn)用集成學(xué)習(xí)方法以及調(diào)整Dropout超參數(shù)等手段。
基于數(shù)據(jù)的方法：主要通過數(shù)據(jù)增強(qiáng)技術(shù)來實(shí)施。這類方法依據(jù)特定的先驗(yàn)知識，在保留關(guān)鍵信息的同時(shí)對原始數(shù)據(jù)進(jìn)行合適的轉(zhuǎn)換，旨在擴(kuò)展數(shù)據(jù)集并提高模型的泛化能力。

（2）欠擬合

????????在圖像分類任務(wù)上，訓(xùn)練數(shù)據(jù)不足也有可能帶來欠擬合的問題。欠擬合是指模型的復(fù)雜度不足以捕捉到數(shù)據(jù)集中的所有重要特征和模式，導(dǎo)致模型在訓(xùn)練集上的表現(xiàn)也不理想，更不用說在未見過的測試集上了。當(dāng)訓(xùn)練數(shù)據(jù)不足時(shí)，模型可能無法從有限的樣本中學(xué)習(xí)到足夠的信息來概括整個(gè)數(shù)據(jù)分布，表現(xiàn)為模型的泛化能力較弱。

????????可以通過上面的兩種思路來嘗試緩解欠擬合：

依賴模型的方法：使用更大規(guī)?；蛘吒顚哟蔚纳窠?jīng)網(wǎng)絡(luò)結(jié)構(gòu)，使模型具有更強(qiáng)的學(xué)習(xí)能力來捕捉數(shù)據(jù)中的復(fù)雜關(guān)系?；蚴褂眠w移學(xué)習(xí)、集成學(xué)習(xí)的方法。
基于數(shù)據(jù)的方法：數(shù)據(jù)增強(qiáng)技術(shù)，對現(xiàn)有的少量訓(xùn)練數(shù)據(jù)進(jìn)行各種變換，例如旋轉(zhuǎn)、翻轉(zhuǎn)、裁剪、縮放、顏色抖動等，以模擬更多的訓(xùn)練樣本。

????????關(guān)于跟多過擬合與欠擬合的概念，可以看看我之前的文章：
【機(jī)器學(xué)習(xí)300問】27、高偏差與高方差是什么？他們對評估機(jī)器學(xué)習(xí)模型起何作用？http://t.csdnimg.cn/EalJu

二、如何解決數(shù)據(jù)不足帶來的問題？

? ? ? ? 這里有很多方法，我之前的文章已經(jīng)講過了，我在本文中拓展將一下圖像的數(shù)據(jù)增強(qiáng)技術(shù)。?

（1）遷移學(xué)習(xí)

?????????利用預(yù)訓(xùn)練的深度學(xué)習(xí)模型，保留其底層特征提取層，并在頂部添加新的全連接層或卷積層，僅用少量標(biāo)注圖像對該部分進(jìn)行微調(diào)。

【機(jī)器學(xué)習(xí)300問】37、什么是遷移學(xué)習(xí)？http://t.csdnimg.cn/Q7aQQ

（2）欠采樣/過采樣技術(shù)

?????????對于類別不平衡問題，可以通過欠采樣冗余類別或過采樣少數(shù)類別的方法來平衡數(shù)據(jù)分布。

【機(jī)器學(xué)習(xí)300問】31、不平衡數(shù)據(jù)集如何進(jìn)行機(jī)器學(xué)習(xí)？http://t.csdnimg.cn/f8SL8

（3）數(shù)據(jù)增強(qiáng)

????????通過對現(xiàn)有的圖像數(shù)據(jù)進(jìn)行各種變換，如翻轉(zhuǎn)、旋轉(zhuǎn)、裁剪、縮放、顏色抖動、平移等操作，生成新的訓(xùn)練樣本，從而擴(kuò)大訓(xùn)練集的大小而不引入額外的真實(shí)數(shù)據(jù)。

【機(jī)器學(xué)習(xí)300問】29、訓(xùn)練數(shù)據(jù)少該怎么辦？數(shù)據(jù)增強(qiáng)http://t.csdnimg.cn/uhLP5

① 色彩空間轉(zhuǎn)換

? ? ? ? 比如手勢識別中，如果圖像訓(xùn)練數(shù)據(jù)過少，可以采取顏色變換的方式增加圖像。圖像處理中常見的顏色空間分布有 RGB、HSV 和 YCrCb 三種空間模型。比較這三種空間模型后發(fā)現(xiàn) RGB 空間由于亮度信息存在三個(gè)顏色通道中，并不相互獨(dú)立，難以從 RGB 顏色空間中有效提取出手勢的膚色信息，而 YCrCb 和 HSV 顏色空間都具有亮度與色度相分離的特點(diǎn)，并且膚色范圍緊密，不易受光照后其他物體的干擾，相對來說更適用提取手勢的膚色信息。RGB 與 YCrCb 空間轉(zhuǎn)化的計(jì)算公式如下所示。

????????這里的R、G、B代表原始RGB顏色空間中的紅色、綠色和藍(lán)色通道值，Y是計(jì)算出的亮度值，Cb和Cr是對應(yīng)于藍(lán)色和紅色的色度分量。公式中加上的128是為了將色度分量的取值范圍從-127至128調(diào)整到0至255的標(biāo)準(zhǔn)8位顏色值區(qū)間。通過這種轉(zhuǎn)換后，可以根據(jù)Cr和Cb的值來判斷像素是否屬于膚色區(qū)域。

② 二值化

????????圖像的二值化處理是將圖像上所有像素點(diǎn)的灰度值設(shè)置為 0 或者 255 過程，使得整個(gè)圖像呈現(xiàn)出明顯的黑白效果，通常選取一個(gè)合適的閾值，當(dāng)圖像中像素值大于或者等于閾值時(shí)判定為前景，將其值設(shè)為 255，反之則判定為背景，將其值設(shè)為 0。圖像的二值化使得圖像變得簡單明了，通過前景和背景的像素值重置可以有效降低背景噪聲，在一定程度增強(qiáng)了特征。

? ? ? ? 下面介紹一個(gè)常用的選取合適閾值的方法——最大類間方差法（也稱Otsu）。其基本思想是將圖像看做前景目標(biāo)和背景環(huán)境兩個(gè)部分組成，用兩部分像素值的方差來估計(jì)前景目標(biāo)和背景環(huán)境之間的差別，通過像素劃分各部分出現(xiàn)的概率和平均灰度級來計(jì)算兩部分的方差，得到使得前景目標(biāo)和環(huán)境背景的類間方差達(dá)到最大的灰度級值默認(rèn)為最佳閾值。最佳閾值的標(biāo)準(zhǔn)判別公式如下所示。

? $\sigma_{\text}^2(t) = \omega_0(t) \omega_1(t) [\mu_0(t) - \mu_1(t)]^2$

? ? ? ? 其中， $t$ 是當(dāng)前的閾值。 $\omega_0(t)$ 和 $\omega_1(t)$ 分別是背景（閾值以下）和前景（閾值以上）的像素占比。 $\mu_0(t)$ 和 $\mu_1(t)$ 分別是背景和前景的像素平均灰度值。 $\sigma_{\text}^2(t)$ 表示類間方差，即背景與前景之間的差異。Otsu的方法就是通過遍歷全部可能的t值，找到最大化 $\sigma_{\text}^2(t)$ 的那個(gè)t值，即最佳閾值。在實(shí)踐中，最大類間方差法是一種高效且自動的閾值選擇方法，尤其在物體識別和圖像分割中被廣泛使用。