臉部特征定位,即在圖像或圖像序列的給定區域內搜索部分或所有人臉特征(如眼、鼻、嘴、耳等)的位置、關鍵點或輪廓線。其中包括眼睛、鼻子、嘴巴、下頜、耳朵以及人臉外輪廓等所有需要提取特征點的位置。臉部特征定位可以為人臉識別、姿態表情分析、人臉跟蹤等研究工作提供重要的幾何信息,特征定位的準確與否直接關系到后續應用的可靠性因而具有舉足輕重的地位。 ASM(Active Shape Models)是基于幾何形狀信息的方法之一,由Cootes等于1992年提出。它采用點分布模型(Point Distribution Model,PDM)描述形狀變化,另一方面計算各特征點法線方向上灰度值的一階偏導,并建立局部紋理模型。在搜索時通過紋理模型得到當前點的最佳匹配位置,然后調節形狀模型,最終達到對特征的精確定位。由于匹配準則的問題ASM容易陷入局部極小點,對于初始位置要求比較高。 Wiskott等將Gabor小波用于人臉識別領域,提出了彈性圖的概念并用于臉部特征的定位。該方法可以適用于一定程度的姿態及表情變化,實踐證明是有效的。由于該方法在搜索時需要在整幅圖上尋找特征點的最佳匹配位置,這一過程十分費時,計算量也很大。Jiao等使用Gabor小波提取局部紋理特征,Gabor特征的幅值與相位包含了豐富的人臉局部紋理信息,在搜索時可以提供指導。由進一步的研究分析可知,不僅特征點的Gabor系數特征包含局部紋理的有用信息,特征點周圍鄰域中各點的Gabor系數特征也是很有用的。基于此,提出了一種基于局部信息的臉部特征定位方法RGASM(Region GaborASM)。 1 標準ASM介紹 1.1 形狀建模 如圖1所示,在ASM中目標形狀用分布在臉輪廓、眼睛及嘴等位置處的一組點的坐標來表示,同類目標形狀構成一個訓練集。為了描述訓練集中各形狀相對于平均形狀的變化,需要建立一個點分布模型(PDM)。該模型給出訓練集中各形狀的平均形狀,同時提供一些參數,通過調整這些參數可以控制形狀的變化。 訓練集中的形狀矢量數學的表示為X=[x1,x2,…,xn,yl,y2,…,yn]T,通過Procrustes方法將訓練集中所有形狀進行對齊,然后對形狀矢量進行主成分分析,得到 X=X+Pb (1) 其中,X是平均形狀,P是特征向量矩陣,b是形狀參數。 矢量b定義了一組形狀參數,可以通過改變b中的元素值使式(1)中的形狀變化。為了使變化后的形狀近似于訓練集中的形狀,應該將b中元素值的變化范圍加以限制。 1.2 局部紋理模型 局部紋理模型用來描述每個特征點周圍區域的紋理特征,ASM的紋理模型是通過統計在特征點所在位置處法線方向采樣所得的灰度剖面的一階差分的變化得到的。 對于第i幅圖像的第j個特征點,在其法線方向采樣得到灰度剖面gij,計算得到訓練集中所有圖像對于第j個特征點的灰度剖面gij(i=l,2,…,N),將它們歸一化并求得平均值gi以及方差矩陣Si,從而建立局部紋理模型。 1.3 搜索過程 采用1.1節和1.2節中方法,可以訓練出一個靈活的形狀模型及局部紋理模型。利用它們可以對新的人臉圖像進行特征點搜索,搜索過程的示意圖,如圖2所示。 其中關鍵是求解達到最佳位置的偏移量。搜索時,同樣沿法線方向采樣得到比建模時長的搜索剖面,在其中尋找與該點對應的灰度模型的均值矢量最匹配的子特征矢量,并將該子特征矢量中心位置作為當前點的最佳匹配位置。目標函數為子特征矢量gs與該點對應模型的均值矢量gj的Mahalanobis距離 分析可知,在當前位置處搜索當前點的最佳匹配位置就需要使得fj(gs)取得最小值。 根據以上所述,在搜索時通過紋理模型得到當前點的最佳匹配位置,然后調節紋理模型,通過不斷的迭代直到形狀的改變量可以忽略不計為止。 2 基于Gabor小波變換的臉部特征定位方法 2.1 利用Gabor小波變換提取局部紋理特征 1964,年,Gabor提出了著名的以自己名字命名的Gabor函數,它是高斯函數在頻域中的平移,能夠同時在時域和頻域中很好的兼顧對信號分析的分辨率要求。二維Gabor函數較好的描述了哺乳動物初級視覺系統對簡單視覺神經元的感受特性。Daugman于上世紀80年代首次將其應用在計算機視覺領域。 二維Gabor函數表達形式為 選擇5個不同頻率,v=O,…,4及8個方向μ=0,…,7,從而得到40個不同的Gabor濾波器j=μ+8v。式(7)括號中的第二項可以使該小波核與直流分量無關,即可以消除積分項 這使得濾波器對圖像光照不均的魯棒性較好。 對圖像I(x)中的一點x=(x,y),定義該點灰度值與Gabor。函數的卷積為 依次用不同頻率與方向組合成的40個Gabor函數進行卷積得到40個復系數,稱它們為一個Jet,記作Jj=ajexp(iφj),用它來表示局部紋理特征。其中幅值aj(x)部分隨著x的變化緩慢變化,相位部分φj(x)以與Gabor核頻率相近的速度旋轉。 2.2 紋理建模 對于訓練集中每幅人臉圖像,筆者定義了一組特征點,Pi(i=1,2,…,n),n是特征點的個數(選取了58個)。對于每個點,Gabor特征計算方法如下 以第i幅圖第j個特征點為中心在其周圍選取一個半徑為4的圓形鄰域Rij,這里i=1,2,…,N,N為訓練集中圖像的個數,j=1,2,…,n,n是特征點的個數,計算該區域內每個點對應的Gabor Jet,將這些Jet連接合成一個新的復矢量JetL,J’ij作為該點的局部特征。假設第j個點對應的J’ij(i=1,…,N)服從多變量高斯分布,求其均值為 從而用每個均值來代替表示所有的J’ij。 2.3 搜索過程 搜索與標準ASM的搜索過程類似,只是在估計當前點的偏移量時有所不同。當前點偏移量的估計采取在特征點當前位置周圍取塊進行全搜索的方法,具體做法如下:以當前Pi點為中心在其周圍取一個大小為16×16的方形鄰域Rei,采用與建模時相同方法計算鄰域中每個點處的特征復矢量Jjs(s=1,…,256)。在Jjs中搜索與該點模型相似度最大的,并將對應點的位置作為當前點的新位置。選取的判定準則為 可知,只需使上式中f(s)取得最小值便可以獲得當前點Pj的偏移量dxj。相同的方法計算得到各點的偏移量,從而得到形狀的改變量dx。 3 實驗結果及分析 為了測試文中提出的方法RGASM的有效性,將它與ASM方法進行比較。這里所用的人臉庫是IMM庫,從庫中挑選了每人兩幅共80幅人臉圖像作為訓練集。圖像的大小為640×480,每幅圖已經進行了特征點的人工標定。特征點個數為58個,分布在眉毛、眼睛、鼻子、嘴以及外輪廓部位。 這里分別做兩種誤差估計,一種是針對單幅圖像的偏差估計,計算給定圖像中搜索得到的特征點位置與對應的人工標定位置的偏移量。如圖4所示,x坐標為特征點搜索所得位置與目標位置的平均偏移量(以像素為單位),y坐標為偏移量為對應值的特征點個數占圖像中特征點總數的百分比。 從圖4可以看出,通過RGASM方法得到的定位結果在平均誤差上小于ASM的平均定位誤差,方差也較小,算法對各特征點定位效果均衡。因此,與ASM方法相比,采用RGASM方法進行特征定位可以在單幅圖像的特征點意義上取得好的定位效果。 另一種是針對整個測試集的平均偏差估計,度量準則為歐式距離 其中N為測試圖像的個數,n為標定特征點的個數,這里N取值為30,為58。(xij,yij)表示在第i幅測試圖像中的j個標定點人工標定的位置,而(x’ij,y’ij)為搜索得到的位置坐標。 表l給出了RGASM方法與ASM方法在特征定位上的效果比較情況。該測試說明在訓練集較小時RGASM方法在定位精度上與ASM相比具有一定的優勢。 測試是在CPU為Pentium(R)43.0 GHz的計算機上完成的,采用標準ASM方法處理一幅圖像的平均時間為0.2~0.4 s,文中的RGASM方法的平均時間為0.6~0.9 s。可以看出,文中提出的方法是有效、可行的。 4 結束語 文中提出了一種基于局部紋理信息的臉部特征定位方法,在紋理建模時對特征點及其給定鄰域各點均做Gabor變換以作為該特征點的局部紋理特征,然后采用統計方法進行局部紋理建模,搜索時采用在當前位置周圍取塊進行全搜索的方法進行特征的搜索定位。實驗結果表明,該方法是一種有效的臉部特征定位方法。 |