尹相志老師表示,人臉識別技術也有著「見山是山、見山不是山、見山又是山」的三個階段。最早期,多數是將人臉識別當作是圖像分類的問題,但是深度學習的圖像分類必須事先設定輸出的類別數,只要類別數量有異動模型就必須重新訓練,這鐵定不符合人們對人臉識別的期待。所以後來基於相似性度量學習 (metric learning) 將學習的目標從分辨是誰的標籤改為如何讓同一個人的不同臉照能夠測得較高的相似度,而不同人的臉照卻能獲得較低的相似度,像是孿生網路、三元組損失 (triplet loss) 就是基於這個思路,但是這種方法收斂速度極其緩慢,且無法做到更龐大的人群基數。
Tag:
疫情
較舊的文章