http://blog.csdn.net/weixingstudio/article/details/7631241 1. 弱分類器 在確定了訓練子窗口中的矩形特征數(shù)量和特征后,需要對每一個特征f ,訓練一個弱分類器h(x,f,p,O) 。 在CSDN里編輯公式太困難了,所以這里和公式有關的都用截圖了。 特別說明:在前
http://blog.csdn.net/weixingstudio/article/details/7631241
在確定了訓練子窗口中的矩形特征數(shù)量和特征值后,需要對每一個特征f ,訓練一個弱分類器h(x,f,p,O) 。
在CSDN里編輯公式太困難了,所以這里和公式有關的都用截圖了。
特別說明:在前期準備訓練樣本的時候,需要將樣本歸一化和灰度化到20*20的大小,這樣每個樣本的都是灰度圖像并且樣本的大小一致,保證了每一個Haar特征(描述的是特征的位置)都在每一個樣本中出現(xiàn)。
在訓練強分類器中,T表示的是強分類器中包含的弱分類器的個數(shù)。當然,如果是采用級聯(lián)分類器,這里的強分類器中的弱分類器的個數(shù)可能會比較少,多個強分類器在級聯(lián)起來。
在c(2)步驟中,“每個特征f”指的是在20*20大小的訓練樣本中所有的可能出現(xiàn)的矩形特征,大概要有80,000中,所有的這些都要進行計算。也就是要計算80,000個左右的弱分類器,在選擇性能好的分類器。
訓練強分類器的步驟如圖:
對于本算法中的矩形特征來說,弱分類器的特征值f(x)就是矩形特征的特征值。由于在訓練的時候,選擇的訓練樣本集的尺寸等于檢測子窗口的尺寸,檢測子窗口的尺寸決定了矩形特征的數(shù)量,所以訓練樣本集中的每個樣本的特征相同且數(shù)量相同,而且一個特征對一個樣本有一個固定的特征值。
對于理想的像素值隨機分布的圖像來說,同一個矩形特征對不同圖像的特征值的平均值應該趨于一個定值k。
這個情況,也應該發(fā)生在非人臉樣本上,但是由于非人臉樣本不一定是像素隨機的圖像,因此上述判斷會有一個較大的偏差。
對每一個特征,計算其對所有的一類樣本(人臉或者非人臉)的特征值的平均值,最后得到所有特征對所有一類樣本的平均值分布。
下圖顯示了20×20 子窗口里面的全部78,460 個矩形特征對全部2,706個人臉樣本和4,381 個非人臉樣本6的特征值平均數(shù)的分布圖。由分布看出,特征的絕大部分的特征值平均值都是分布在0 前后的范圍內(nèi)。出乎意料的是,人臉樣本與非人臉樣本的分布曲線差別并不大,不過注意到特征值大于或者小于某個值后,分布曲線出現(xiàn)了一致性差別,這說明了絕大部分特征對于識別人臉和非人臉的能力是很微小的,但是存在一些特征及相應的閾值,可以有效地區(qū)分人臉樣本與非人臉樣本。
為了更好地說明問題,我們從78,460 個矩形特征中隨機抽取了兩個特征A和B,這兩個特征遍歷了2,706 個人臉樣本和4,381 個非人臉樣本,計算了每張圖像對應的特征值,最后將特征值進行了從小到大的排序,并按照這個新的順序表繪制了分布圖如下所示:
可以看出,矩形特征A在人臉樣本和非人臉樣本中的特征值的分布很相似,所以區(qū)分人臉和非人臉的能力很差。
下面看矩形特征B在人臉樣本和非人臉樣本中特征值的分布:
可以看出,矩形特征B的特征值分布,尤其是0點的位置,在人臉樣本和非人臉樣本中差別比較大,所以可以更好的實現(xiàn)對人臉分類。
由上述的分析,閾值q 的含義就清晰可見了。而方向指示符p 用以改變不等號的方向。
一個弱學習器(一個特征)的要求僅僅是:它能夠以稍低于50%的錯誤率來區(qū)分人臉和非人臉圖像,因此上面提到只能在某個概率范圍內(nèi)準確地進行區(qū)分就
已經(jīng)完全足夠。按照這個要求,可以把所有錯誤率低于50%的矩形特征都找到(適當?shù)剡x擇閾值,對于固定的訓練集,幾乎所有的矩形特征都可以滿足上述要求)。每輪訓練,將選取當輪中的最佳弱分類器(在算法中,迭代T 次即是選擇T 個最佳弱分類器),最后將每輪得到的最佳弱分類器按照一定方法提升(Boosting)為強分類器
訓練一個弱分類器(特征f)就是在當前權(quán)重分布的情況下,確定f 的最優(yōu)閾值,使得這個弱分類器(特征f)對所有訓練樣本的分類誤差最低。
選取一個最佳弱分類器就是選擇那個對所有訓練樣本的分類誤差在所有弱分類器中最低的那個弱分類器(特征)。
對于每個特征 f,計算所有訓練樣本的特征值,并將其排序。通過掃描一遍排好序的特征值,可以為這個特征確定一個最優(yōu)的閾值,從而訓練成一個弱分類器。具體來說,對排好序的表中的每個元素,計算下面四個值:
注意,這里所說的T=200個弱分類器,指的是非級聯(lián)的強分類器。若果是用級聯(lián)的強分類器,則每個強分類器的弱分類器的個數(shù)會相對較少。
一般學術界所說的級聯(lián)分類器,都是指的是級聯(lián)強分類器,一般情況有10個左右的強分類器,每個強分類有10-20個弱分類器。當然每一層的強分類器中弱分類器的個數(shù)可以不相等,可以根據(jù)需要在前面的層少放一些弱分類器,后面的層次逐漸的增加弱分類器的個數(shù)。
在對輸入圖像進行檢測的時候,一般輸入圖像都會比20*20的訓練樣本大很多。在Adaboost 算法中采用了擴大檢測窗口的方法,而不是縮小圖片。
為什么擴大檢測窗口而不是縮小圖片呢,在以前的圖像檢測中,一般都是將圖片連續(xù)縮小十一級,然后對每一級的圖像進行檢測,最后在對檢測出的每一級結(jié)果進行匯總。然而,有個問題就是,使用級聯(lián)分類器的AdaBoost的人臉檢測算法的速度非常的快,不可能采用圖像縮放的方法,因為僅僅是把圖像縮放11級的處理,就要消耗一秒鐘至少,已經(jīng)不能達到Adaboost 的實時處理的要求了。
因為Haar特征具有與檢測窗口大小無關的特性(想要了解細節(jié)還要讀一下原作者的文獻),所以可以將檢測窗口進行級別方法。
在檢測的最初,檢測窗口和樣本大小一致,然后按照一定的尺度參數(shù)(即每次移動的像素個數(shù),向左然后向下)進行移動,遍歷整個圖像,標出可能的人臉區(qū)域。遍歷完以后按照指定的放大的倍數(shù)參數(shù)放大檢測窗口,然后在進行一次圖像遍歷;這樣不停的放大檢測窗口對檢測圖像進行遍歷,直到檢測窗口超過原圖像的一半以后停止遍歷。因為 整個算法的過程非???,即使是遍歷了這么多次,根據(jù)不同電腦的配置大概處理一幅圖像也就是幾十毫秒到一百毫秒左右。
在檢測窗口遍歷完一次圖像后,處理重疊的檢測到的人臉區(qū)域,進行合并等操作。
程序代碼樣例請到第一節(jié)找下載地址。
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com