【AI60問】Q47什麼是人臉識別(Face Recognition)?

by 提拔我園丁
緯育TibaMe AI小教室-Q47什麼是人臉識別?

人臉辨識又稱臉部辨識(Face Recognition), 特指利用分析比較臉部視覺特徵資訊進行身分鑑別的電腦技術。 是以圖像採集以及擷取人臉影像進行分析比對,以作為身份認證的運算技術,相較於指紋、虹膜等生物辨識方式,不需要近距離接觸,也能準確進行辨識,還能同時辨識多人,增加人員管理的效率。

廣義的臉部辨識,實際包括構建臉部辨識系統的一系列相關技術,包括:臉部圖像採集、臉部定位、臉部辨識預處理、身分確認以及身分尋找等;而狹義的臉部辨識特指通過臉部進行身分確認或者身分尋找的技術或系統。

一、人臉識別問題宏觀上分為兩類:

1、人臉驗證(Face Verification,又叫人臉比對)

是1比1的比對,即判斷兩張圖片裡的人是否為同一人。最常見的應用場景便是人臉解鎖,終端設備(如手機)只需將用戶事先註冊的照片與臨場採集的照片做對比,判斷是否為同一人,即可完成身份驗證。

2、人臉識別(Face Identification)

是1比N的比對,即判斷系統當前見到的人,為事先見過的眾多人中的哪一個。比如疑犯追蹤,社區門禁,會場簽到,以及新零售概念裡的客戶識別。這些應用場景的共同特點是:人臉識別系統都事先存儲了大量的不同人臉和身份資訊,系統運行時需要將見到的人臉與之前存儲的大量人臉做比對,找出匹配的人臉。

兩者在早期(2012年~2015年)是通過不同的演算法框架來實現的,想同時擁有人臉驗證和人臉識別系統,需要分開訓練兩個神經網路。而2015年Google的Facenet論文的發表改變了這一現狀,將兩者統一到一個框架裡。

緯育TibaMeAI 60問-圖 47-1 人臉驗證(Face Identification)與人臉識別(Face Identification)
圖 47-1 人臉驗證(Face Identification)與人臉識別(Face Identification)

二、「人臉識別」怎麼做識別?

首先需要引入的的是「特徵」的概念。先看下面這個例子:

緯育TibaMeAI 60問-圖 47-2 人臉的簡單的特徵
圖 47-2 人臉的簡單的特徵

假設這5個特徵足夠形容一張人臉,那每張人臉都可表示為這5個特徵的組合:(特徵1, 特徵2, 特徵3, 特徵4, 特徵5)

一位雙眼皮,挺鼻樑,藍眼睛,白皮膚,瓜子臉的歐美系小鮮肉即可用特徵表示為(見表格加粗項):(1, 1, 0, 1, 0)

那麼上面這張特徵表格一共可以代表 25=32 張不同的臉。32張臉可遠遠不夠覆蓋70多億的人口。為了讓不同特徵組成的人臉能覆蓋足夠多人臉,我們需要擴充上面那張特徵表。擴張特徵表可以從行、列兩個角度展開。

列的角度很簡單,只需要增加特徵數量:(特徵6.臉型,特徵7.兩眼之間距離,特徵8.嘴唇厚薄…)實際應用中通常應用128、256、512或者1024個不同特徵,這麼多特徵從哪來,該不會人為一個一個去設計吧?這個問題在後面會解答。

從行的角度擴充也很好理解,比如“特徵3”,除了值0代表藍色,值1代表灰色,是不是可以增加一個值2代表黑色,值3代表沒有頭髮呢?此外,除了這些離散的整數,我們也可以取連續的小數,比如特徵3的值0.1,代表“藍中略微帶黑”,值0.9代表“灰中帶藍”…

經過這樣的擴充,特徵空間便會變得無限大。擴充後特徵空間裡的一張臉可能表示為:(0, 1, 0.3, 0.5, 0.1, 2, 2.3, 1.75,…)

之前提出的問題:用於表示人臉的大量特徵從哪來?

這便是深度學習(深度神經網路)發揮作用的地方。它透過在千萬甚至億級別的人臉資料庫上學習訓練後,會自動總結出最適合於電腦理解和區分的人臉特徵。演算法工程師通常需要一定的視覺化手段才能知道機器到底學習到了哪些利於區分不同人的特徵。明瞭不同人臉由不同特徵組成後,我們便有了足夠的知識來分析人臉識別,到底怎麼識別。

👉 提升深度學習實作作能力必備, TensorFlow 基礎與應用

結帳輸入優惠碼「BLOGONLY200」,TensorFlow 基礎與應用線上課程現折$200!

現在考慮最簡單最理想的情況,用於區分不同人的特徵只有兩個:特徵1和特徵2。那麼每一張臉都可以表示為一個座標(特徵1,特徵2),即特徵空間(這個例子裡是二維空間)內的一個點。

人臉識別基於一個默認成立的假設:同一個人在不同照片裡的臉,在特徵空間裡非常接近。為什麼這個假設默認成立,設想一下,一個棕色頭髮的人,在不同光照,遮擋,角度條件下,發色看起來雖然有輕微的區別,但依然與真實顏色非常接近,反應在發色的特徵值上,可能是0到0.1之間的浮動。

深度學習的另一任務和挑戰便是在各種極端複雜的環境條件下,精確的識別各個特徵的範例,三張山下智久的照片經過神經網路提取出128維的特徵後,變成了3個在128維空間中的點(紅色),石原裡美的特徵點為綠色,這張圖想表達同樣的意思:同一人的不通照片提取出的特徵,在特徵空間裡距離很近,不同人的臉在特徵空間裡相距較遠。

緯育TibaMeAI 60問-圖 47-3 理想的人臉特徵在特徵空間的分佈
圖 47-3 理想的人臉特徵在特徵空間的分佈

再來考慮人臉識別領域的兩個問題:

1、人臉驗證

比如FaceID人臉解鎖,Iphone事先存了一張使用者的照片(需要使用者註冊),這張照片變成了轉換成了一連串特徵數值(即特徵空間裡的一個點),用戶解鎖時,手機只需要對比當前採集到的臉和事先註冊的臉在特徵空間裡的幾何距離,如果距離足夠近,則判斷為同一人,如果距離不夠近,則解鎖失敗。距離跨值的設定,則是演算法工程師通過大量實驗得到的。

2、人臉識別

同樣考慮一個場景,人臉考勤。公司X有員工A、B、C,公司會要求三名員工在入職的時候各提供一張個人照片用於註冊在公司系統裡,靜靜地躺在特徵空間中。第二天早上員工A上班打卡時,將臉對準考勤機器,系統會把當前員工A的臉放到特徵空間裡,與之前特徵空間裡註冊好的臉一一對比,發現註冊的臉中距離當前採集到的臉最近的特徵臉是員工A,打卡完畢。

👉 深入學習影像辨識,探索OpenCV 的多種應用

結帳輸入優惠碼「BLOGONLY200」,OpenCV 應用線上課程現折$200!

三、 人臉辨識功能及應用領域

1、門禁系統:

門禁系統是最常見的應用方式,許多公司或政府機構都會使用人臉辨識進行門禁管理,員工不必攜帶員工證、門禁卡就能打卡上下班,還能防止陌生人任意進出,具有遏止犯罪的效果。

2、快速通關:

最常見的例子是過海關的時候,可以透過臉部辨識加上掃描護照及指紋感應來快速通關,節省海關審查的時間,未來如果能夠應用在搭乘大眾交通工具上,就能大幅縮短排隊的時間,快速疏散人群。

3、Face ID:

Face ID臉部解鎖功能,已經漸漸成為智慧型手機的標準配備,有別於指紋解鎖功能,Face ID的解鎖速度更快,而且可以避免手指潮濕、有異物影響解鎖功能的情況。

4、刷臉付款:

最有名的例子是中國的支付寶,到支援刷臉付款的店家消費,只要進行臉部辨識就能快速完成付款,大幅縮短付款流程,減少排隊的時間,提升用戶體驗。

👉 了解人臉技術與落地所需要掌握的最新觀念與實作技巧

結帳輸入優惠碼「BLOGONLY200」,人臉辨識線上課程現折$200!

想成為爬蟲工程師 、資料分析師 、資料工程師 、資料分析領域專家 、人工智慧產品經理嗎?還是你的公司正需要培養此領域人才呢?

點我了解 AI資料科學家全方位學程 👉 https://bit.ly/3o4N39e  

每日5分鐘, 提拔我園丁陪你快速添補AI/資料科學知識與技能。

若想了解更多AI/資料科學的小知識、及各產業的相關應用,歡迎訂閱TibaMe FB及部落格,或有其他想了解的主題歡迎在下方留言讓我們知道唷!

參考資料

分享這篇文章:
0 留言
4

您也許會喜歡

發佈留言

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料