人臉識(shí)別中,取出準(zhǔn)確的有效特征值,即使在不一樣的光源、拍攝時(shí)間、些微的表情、視角變化,仍能正確判斷,是數(shù)十年來(lái)研究的挑戰(zhàn)工作。而近來(lái)人臉識(shí)別的穩(wěn)定度可以提升到滿足產(chǎn)業(yè)應(yīng)用,在于兩個(gè)主要因素:深度卷積網(wǎng)絡(luò)的發(fā)展以及大量的人臉訓(xùn)練數(shù)據(jù)。
卷積網(wǎng)絡(luò)利用層狀的結(jié)構(gòu)來(lái)逐步表示影像中的復(fù)雜信號(hào),由低階的線條到高階富有語(yǔ)意(semantic meaning)的物件、情境等。每個(gè)階層皆有數(shù)十個(gè)(到百個(gè))卷積單元的單元組成—可以想像在各層輸入畫面進(jìn)行特殊的樣式檢測(cè),再將諸多檢測(cè)結(jié)果(反應(yīng)強(qiáng)度)交給下一層繼續(xù)檢測(cè)。一般階層個(gè)數(shù)由數(shù)個(gè)到上百個(gè),端看基底網(wǎng)絡(luò)架構(gòu)以及應(yīng)用復(fù)雜度。目前人臉識(shí)別的主流是采用ResNet型態(tài)(在2015年底由任職于微軟研究院的何凱明博士率先提出)的基底網(wǎng)絡(luò)。
識(shí)別時(shí),取出末端一層網(wǎng)絡(luò)輸出做為人臉(高緯)特征值。過(guò)去的方法,不管是特征臉、局部二值模式、稀疏編碼等,一般類似于使用一到兩層的卷積運(yùn)算來(lái)逼近,相對(duì)上,稱為「淺層」作法。與深度卷積網(wǎng)絡(luò)來(lái)比,參數(shù)使用量(復(fù)雜度)低,特征值描述能力相當(dāng)薄弱。更重要的,當(dāng)利用大量數(shù)據(jù)訓(xùn)練卷積網(wǎng)絡(luò)時(shí),這些重要的檢測(cè)樣式還可以由訓(xùn)練樣本中自動(dòng)學(xué)出,目的是為了讓最后的識(shí)別效果達(dá)到最好。之前的方法,常從經(jīng)驗(yàn)當(dāng)中判斷設(shè)計(jì),不一定吻合應(yīng)用情境。
目前在國(guó)際研究社區(qū)也分享了相當(dāng)多的人臉訓(xùn)練數(shù)據(jù),甚至達(dá)到百萬(wàn)人的數(shù)目。為何可以收集到這些數(shù)據(jù)?主要來(lái)自于網(wǎng)絡(luò)名人(明星、新聞人物)以及社群網(wǎng)站上的公開相簿。但是這也衍伸出其他的問(wèn)題,比如說(shuō)這些免費(fèi)人臉數(shù)據(jù)中絕大部分為西方人,絕少戴眼鏡,畫質(zhì)清晰,在實(shí)際場(chǎng)域上還有某些技術(shù)問(wèn)題得克服,但是已經(jīng)大大降低數(shù)據(jù)收集耗時(shí)、耗費(fèi)的問(wèn)題。
除數(shù)據(jù)外,訓(xùn)練卷積網(wǎng)絡(luò)的目標(biāo)函數(shù)(Cost Function)也占了非常重要的角色,比如說(shuō)單使用常用的交叉熵(Cross-Entropy)來(lái)訓(xùn)練人臉識(shí)別的穩(wěn)定度,遠(yuǎn)遠(yuǎn)比不上Large Margin 的系列作法—因?yàn)椴恢辉谟?xùn)練網(wǎng)絡(luò)中將人臉正確預(yù)測(cè),還得讓不屬于同個(gè)人的人臉特征值分隔遙遠(yuǎn),反之,則得十分接近。
利用目標(biāo)函數(shù),還有增益訓(xùn)練數(shù)據(jù)的技術(shù),還可以訓(xùn)練網(wǎng)絡(luò)解決人臉光影變化過(guò)大、化妝、眼鏡的問(wèn)題,甚至是低解析度的人臉識(shí)別。在特殊的安全應(yīng)用上,更可以部分解決人臉偽裝的問(wèn)題,最近我們獲得國(guó)際偽裝人臉識(shí)別競(jìng)賽冠軍,也驗(yàn)證了這些作法。
人臉識(shí)別技術(shù)發(fā)展逐漸成熟,更可能溢出傳統(tǒng)安防領(lǐng)域而成為「?jìng)€(gè)人化」的基礎(chǔ)引擎,而影響各種應(yīng)用情境。如果整合我們擅長(zhǎng)的硬件(系統(tǒng)、芯片)技術(shù),似乎在產(chǎn)業(yè)應(yīng)用上也帶來(lái)了新的機(jī)會(huì)!
原文標(biāo)題:【名家專欄】人臉識(shí)別—深度卷積網(wǎng)絡(luò)帶來(lái)的突破
文章出處:【微信號(hào):DIGITIMES,微信公眾號(hào):DIGITIMES】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。