來(lái)源:澎湃新聞 斯坦福大學(xué)的邁克爾·科辛斯基(Michal Kosinski)和王軼倫發(fā)現(xiàn),通過(guò)從3萬(wàn)多張人臉圖像中提取出來(lái)的特征,計(jì)算機(jī)識(shí)別出同性戀男性的準(zhǔn)確率最高可達(dá)到91%,同性戀女性則為83%。論文認(rèn)為,與產(chǎn)前激素理論一致,同性戀男性的長(zhǎng)相更“女性化”,下巴更窄,鼻子更長(zhǎng),額頭更大,同性戀女性則相反。 這篇題為《深度神經(jīng)網(wǎng)絡(luò)基于人臉圖像判斷性取向比人類更準(zhǔn)確》的論文于9月7日發(fā)表在《人格與社會(huì)心理學(xué)雜志》(Journal of Personality and Social Psychology)上后,引發(fā)了媒體和社交網(wǎng)絡(luò)的熱議。 英國(guó)《衛(wèi)報(bào)》擔(dān)心,這項(xiàng)技術(shù)會(huì)導(dǎo)致青少年“自測(cè)”,夫妻“互測(cè)”,而在對(duì)同性戀處以死刑的國(guó)家,這項(xiàng)技術(shù)更可能淪為殺人工具。 不過(guò),在作者看來(lái),他們的研究是針對(duì)人臉識(shí)別技術(shù)和互聯(lián)網(wǎng)隱私問(wèn)題的警告,是對(duì)未來(lái)可能成真的技術(shù)濫用的演示。作者在文章中呼吁,政府和企業(yè)應(yīng)制定相關(guān)法規(guī),發(fā)展相關(guān)技術(shù),降低同性戀群體的隱私風(fēng)險(xiǎn)。 異性戀(左)、同性戀(中)男女的復(fù)合面部圖像,最右為異性戀(綠色)、同性戀(紅色)男女的平均面部標(biāo)記 論文的摘要寫道:“我們發(fā)現(xiàn)人臉中包含的有關(guān)性取向的信息遠(yuǎn)比人腦能夠感知到的多。我們用深度神經(jīng)網(wǎng)絡(luò)從35326張面部圖像中提取特征。我們將這些特征輸入邏輯回歸算法,對(duì)性取向進(jìn)行分類。給定單張面部圖像,分類器能以81%的概率區(qū)別同性戀和異性戀男性,女性則為71%。人類的判斷準(zhǔn)確率則要低得多:男性61%,女性54%。給定同一個(gè)人的5張面部圖像,算法的準(zhǔn)確率可以相應(yīng)提高到91%和83%。分類器利用的面部特征,有鼻子形狀等固定特征,也有打扮風(fēng)格等臨時(shí)特征。同性戀男性和女性傾向于具備性別非典型的面部形態(tài)、表情和打扮風(fēng)格,這與產(chǎn)前激素暴露影響性取向的理論相符合。而性別分類模型檢測(cè)同性戀男性的準(zhǔn)確率為 57%,同性戀女性的準(zhǔn)確率為 58%。這些發(fā)現(xiàn)提高了我們對(duì)性取向起源以及人類認(rèn)知缺陷的理解。此外,公司與政府越來(lái)越多地使用計(jì)算機(jī)視覺(jué)算法探測(cè)人的內(nèi)在特征,我們的研究揭示出同性戀的隱私與安全正在面臨威脅。” 算法準(zhǔn)確率:男性91%,女性83% 研究者從美國(guó)交友網(wǎng)站上獲取了公開(kāi)資料,包括36630名男性的130741張照片和38593名女性的170360張照片,年齡在18歲到40歲之間。他們的性取向則是通過(guò)意向伴侶性別獲悉的。 隨后,研究者將這些照片中的人臉用Face++軟件進(jìn)行了處理,剔除了一些照片。接著,他們?nèi)斯ずY選這些照片是否是成年白人,性別與網(wǎng)絡(luò)資料是否相符。最后,他們隨即剔除了一些照片,以平衡異性戀和同性戀的人數(shù),留下的樣本包含同性戀和異性戀男性各3947名,同性戀和異性戀女性各3441名。 對(duì)美國(guó)交友網(wǎng)站上獲取的公開(kāi)照片進(jìn)行處理 研究者使用一個(gè)名為VGG-Face的深度神經(jīng)網(wǎng)絡(luò)提取圖像的特征,并以此訓(xùn)練邏輯回歸模型。實(shí)驗(yàn)結(jié)果顯示,給定單張面部圖像,分類器能以81%的概率區(qū)別同性戀和異性戀男性,女性則為71%。給定同一個(gè)人的5張面部圖像,算法的準(zhǔn)確率可以相應(yīng)提高到91%和83%。 給定個(gè)體男性(藍(lán)色)、女性(紅色)1至5張照片,算法的準(zhǔn)確率提高 符合產(chǎn)前激素理論:同性戀男性更“女性化”? 在引言部分,作者說(shuō)明,他們選擇研究性取向的一個(gè)重要原因是“廣為接受的性取向的產(chǎn)前激素理論(PHT),預(yù)測(cè)了外表與性取向的關(guān)系”。 論文寫道,根據(jù)產(chǎn)前激素理論,男性胚胎過(guò)少地暴露在雄性激素中,或女性胚胎過(guò)多地暴露在雄性激素中,都可能造成性取向異化。然而,雄性激素同樣與兩性面部分化有關(guān),產(chǎn)前激素理論預(yù)測(cè)同性戀人群傾向于具備性別上不典型的面部形態(tài)。即,同性戀男性面部應(yīng)該更女性化,同性戀女性面部應(yīng)該更男性化。 研究者通過(guò)分類器識(shí)別的位點(diǎn)集合成了計(jì)算機(jī)認(rèn)為“最像同性戀”和“最不像同性戀”的人臉。論文認(rèn)為,計(jì)算機(jī)識(shí)別結(jié)果與產(chǎn)前激素理論相符合,同性戀長(zhǎng)相在性別上更不典型。平均來(lái)講,同性戀男性的下巴更窄,鼻子更長(zhǎng),額頭更大;同性戀女性則相反。 顏色越紅的區(qū)域,在算法中越重要 為了進(jìn)一步檢驗(yàn)“同性戀長(zhǎng)相更不具備性別典型性”這一假設(shè),研究者還通過(guò)一個(gè)準(zhǔn)確率98%的性別分類器試圖區(qū)別同性戀和異性戀,發(fā)現(xiàn)在男性身上的準(zhǔn)確率為 57%,在女性身上的準(zhǔn)確率為 58%。論文寫到:“數(shù)據(jù)顯示,男性面部的女性化程度與同性戀概率呈正相關(guān),女性則相反。” 研究的幾點(diǎn)局限性 不過(guò),在論文的討論部分,作者強(qiáng)調(diào)研究結(jié)論不應(yīng)被讀者誤讀。首先,同性戀長(zhǎng)相更不具備性別典型性,不代表所有的同性戀男性長(zhǎng)相都女性化,也不代表所有同性戀女性長(zhǎng)相都不女性化。 其次,不應(yīng)誤讀91%這個(gè)實(shí)驗(yàn)中的數(shù)值。在美國(guó)的同性戀比例大約為6%到7%的情況下,分類器需要大幅犧牲準(zhǔn)確率,才能覆蓋大量的樣本。 論文也自我指出了研究的幾點(diǎn)限制:樣本限于白人、沒(méi)有排除雙性戀,以及無(wú)法排除長(zhǎng)相“更同性戀”的人更容易“出柜”這一點(diǎn)。 作者也拋出了其他幾個(gè)有趣的問(wèn)題,比如同性戀男性更少留胡子,主要是生理原因(毛發(fā)稀少)還是品味原因?分類器識(shí)別男性比女性更準(zhǔn)確,是否意味著女性的性取向更具流動(dòng)性? 看臉識(shí)罪犯、識(shí)貧富、識(shí)同性戀:科學(xué)相面術(shù)? 近年來(lái),計(jì)算機(jī)視覺(jué)識(shí)別技術(shù)發(fā)展迅速。從辦理身份證件、電子支付到機(jī)場(chǎng)安檢、辦公門禁,人臉識(shí)別技術(shù)正在大規(guī)模進(jìn)入人們的日常生活。不過(guò),一些研究者試圖通過(guò)計(jì)算機(jī)視覺(jué)識(shí)別,尋找外表特征和內(nèi)在性格的聯(lián)系,引發(fā)了廣泛的爭(zhēng)議。 去年11月,上海交通大學(xué)武筱林教授的《基于面部圖像的自動(dòng)犯罪概率推斷》一文指出,機(jī)器可以通過(guò)照片分辨出誰(shuí)是罪犯,誰(shuí)是守法公民,識(shí)別準(zhǔn)確率在86%以上。隨后,加拿大多倫多大學(xué)一項(xiàng)機(jī)器看臉識(shí)貧富的研究,同樣引發(fā)了一些爭(zhēng)議。 此前,一家以色列初創(chuàng)公司聲稱其開(kāi)發(fā)的人臉識(shí)別程序成功識(shí)別了參與2015年11月巴黎恐怖襲擊的9名恐怖分子,還能識(shí)別戀童癖與白領(lǐng)罪犯。 盡管這些研究倍受倫理爭(zhēng)議,但從論文來(lái)看,科辛斯基和王軼倫顯然并不認(rèn)同將這方面的研究完全劃歸禁區(qū)。 在引言部分,論文提到,相面術(shù)可回溯至古中國(guó)和古希臘,畢達(dá)哥拉斯就曾“看臉”收門生。而意大利外科醫(yī)生龍勃羅梭在19世紀(jì)初開(kāi)創(chuàng)了“天生犯罪人理論”,指出罪犯可以通過(guò)臉部特征識(shí)別。 “如今,相面術(shù)被廣泛認(rèn)定為一種糅合迷信與種族主義的偽科學(xué)。由于合法性問(wèn)題,研究、甚至是討論面部特征和性格之間的聯(lián)系都成為了禁忌。聯(lián)系不存在,這成了一個(gè)普遍的前提。然而,很多機(jī)制暗示,情況是相反的。” “重要的是,人類看臉判斷性格的準(zhǔn)確率低,并不一定說(shuō)明線索不是明明白白地?cái)[在那里。只是,人類可能缺乏探測(cè)或解讀的能力……因此,我們用現(xiàn)代計(jì)算機(jī)視覺(jué)算法檢驗(yàn)這個(gè)假設(shè)。” 同性戀群體危險(xiǎn)了! 論文的作者試圖通過(guò)這一研究警告我們,社交平臺(tái)上的公開(kāi)數(shù)據(jù),可以被人利用,制作針對(duì)性取向的分類器。文章寫道:“預(yù)測(cè)性取向可能對(duì)同性戀男女和整個(gè)社會(huì)都造成嚴(yán)重威脅,甚至生命威脅。……許多國(guó)家的法律認(rèn)定同性戀是犯罪,8個(gè)國(guó)家會(huì)將同性戀處以死刑。因此,我們讓決策者、科技企業(yè)和同性戀群體知道看臉識(shí)同性戀的準(zhǔn)確率可以有多高,這很關(guān)鍵。” 雖然論文所演示的恰恰是論文所反對(duì)的,作者強(qiáng)調(diào),他們并非要制造一種入侵的工具,而是為了演示一些常用的入侵路徑。就在眼下,一些政府和企業(yè)就在研究人臉識(shí)別和內(nèi)在人格之間的聯(lián)系,風(fēng)險(xiǎn)預(yù)警迫在眉睫。作者希望,他們的研究能提醒政府和企業(yè),制定相關(guān)法規(guī),發(fā)展相關(guān)技術(shù),降低同性戀群體的隱私風(fēng)險(xiǎn)。 社交網(wǎng)站信息顯示,科辛斯基是斯坦福商學(xué)院的助理教授,2014年在劍橋大學(xué)獲得心理學(xué)博士學(xué)位。他曾供職于微軟研究院和劍橋大學(xué),在公開(kāi)言論中曾多次談及隱私問(wèn)題。王軼倫本科畢業(yè)于浙江大學(xué),2016年在斯坦福獲碩士學(xué)位,目前是IDG資本駐舊金山灣區(qū)的投資顧問(wèn),投資領(lǐng)域?qū)W⒂贏I、機(jī)器人、機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺(jué)等。 王軼倫(左)、科辛斯基(右) |