文/楊宏文(Hubert)
在社群媒體中識別彼此的首要之務,就是透過一張自己的大頭照。因為這攸關自己的顏面,許多人甚至也樂意付一點錢去產生一些有趣又好看的大頭照,娛樂自己和親友。
以LINE為例,只要進入「個人檔案工作室」,使用380個LINE代幣,上傳8~12幾張臉部照片讓他學習,就可以依據你的需求,做出3D角色的你、更有青春氣息的你、可愛卡通版的妳、學校風格的AI畢業照、亮眼又專業的AI商務照。
筆者也常推薦朋友使用PlaygroundAI與Replicate合作的AI繪圖平台,在有限的額度內「免費」做幾張自己的AI大頭照,體驗一下以圖生圖的樂趣。
你看,只要在手機或電腦上打開 playground.com/face ,連動google帳號,就可以在這平台上建立一個免費帳號。然後就可以免費製作五張AI大頭照,可以是具視覺吸引力和真實感的3D風格、具有趣味性和高度可識別性的 Emoji (表情符號) 風格、有可愛和親切的質感的 Clay (黏土雕塑) 風格、強調趣味性和可玩性的 Toy (玩具) 風格等等。
AI是怎麼將我畫得這麼像的?
這需要四個程序,首先是在照片中找到你的臉,識別出臉上的特徵 (眼睛、鼻子、嘴巴),跟資料庫中的人臉做特徵比對,確保不會有認知上的錯誤,最後才是生成逼真的人臉圖像。
讓我們進一步來了解這四個程序
1. 檢測人臉 (Face Detection)
檢測人臉是生成逼真人臉圖像的第一步,包含以下三個主要步驟:
- 面部檢測算法:使用卷積神經網路 (CNN) 等深度學習技術來定位圖像中的人臉區域。常用算法包括Haar級聯分類器、YOLO、MTCNN(Multi-task Cascaded Convolutional Networks)等。這些算法通過掃描圖像並識別出可能包含人臉的區域。
- 多尺度檢測:為了應對不同大小和距離的人臉,系統會在多個尺度上進行檢測。圖像會被縮放到不同的大小,確保無論人臉在圖像中的位置和比例如何,都能被準確檢測到。這樣可以提高檢測的準確性和覆蓋範圍。
- 面部位置標記:在檢測到人臉後,系統會標記出人臉的具體位置和邊界框。這些標記訊息將用於後續的特徵提取步驟。有時還會進行初步的姿態估計,以確保面部特徵的準確定位。
2. 提取特徵 (Feature Extraction)
提取特徵是生成逼真人臉圖像的關鍵步驟,包含以下三個主要步驟:
- 關鍵點檢測:通過深度學習模型 (如FAN,Facial Alignment Network) 來檢測人臉上的關鍵點,例如眼睛、鼻子、嘴巴等。這些關鍵點可以幫助準確地定位面部的主要結構。典型的人臉關鍵點檢測模型通常會標記68個或更多的特徵點。
- 特徵向量生成:將檢測到的關鍵點和其他面部特徵轉換為數據向量。這些特徵向量包含了人臉的主要特徵信息,可以用於進一步的比對和生成。特徵向量通常會包含形狀、紋理和顏色等多種信息。
- 特徵標準化:將提取的特徵進行標準化處理,以確保在不同條件下(如光線、角度)的特徵一致性。標準化過程可能包括特徵尺度的調整和特徵位置的對齊。這一步驟有助於提高後續比對和生成的準確性。
3. 比對特徵 (Feature Matching)
比對特徵是確保生成圖像真實性和一致性的重要步驟,包含以下三個主要步驟:
- 特徵匹配算法:使用歐幾里得距離、餘弦相似度等算法來比對提取的特徵向量。比對的目的是確認圖像中的人臉是否與已知數據庫中的某個人臉相匹配。這些算法可以有效地測量不同人臉特徵之間的相似性。
- 數據庫查詢:將提取的特徵向量與已知人臉數據庫中的特徵進行比對。數據庫通常包含大量已知的人臉特徵,可以用於身份確認或檢測重複的人臉。比對過程可能涉及多層次的篩選和確認,以提高準確性。
- 輔助生成:根據比對結果,為生成人臉圖像提供參考依據,以保證生成圖像在細節特徵上與真實人臉相符合。這一步驟有助於生成逼真且與特定身份相符的人臉圖像。
4. 生成圖像 (Image Generation)
生成圖像是最終步驟,包含以下三個主要步驟:
- 圖像合成:使用生成對抗網絡(GAN)或其他深度學習技術來生成新的圖像。GAN包括生成器和判別器兩個部分,生成器負責創建圖像,判別器則評估圖像的真實性。反覆訓練之後,生成器學會生成逼真的人臉圖像。
- 細節優化:對生成的圖像進行細節優化,確保面部特徵的細緻和自然。這可能包括添加皮膚紋理、調整光影效果和增強顏色等。優化過程有助於提高圖像的真實感和視覺效果。
- 最終輸出:將生成的圖像進行最終處理,確保圖像的分辨率和品質達到要求。生成的圖像可以輸出為多種格式,用於不同的應用場景。
我可以拿別人的頭像來給AI生成嗎?
利用他人的頭像來生成AI圖片可能涉及多種法律和倫理問題,以下是需要考慮的幾點:
- 肖像權:未經他人同意,使用其頭像進行AI生成圖片可能侵犯其肖像權。台灣《民法》第18條明確規定了關於肖像權的保護。該條款指出,未經本人同意,不得以營利為目的利用他人肖像。這意味著任何人不得在未獲得當事人明確同意的情況下,使用其肖像進行商業活動或其他營利行為。
- 隱私權:使用他人的頭像可能涉及隱私權問題。《民法》第195條規定了關於人格權侵害的損害賠償,這包括隱私權的侵害。條文指出,非依法律或契約之規定,任何人不得非法侵害他人之名譽、信用、隱私、自由或其他人格法益。違反者應負損害賠償責任。
- 著作權 (版權):如果您使用的頭像本身受版權保護,則也需要獲得版權持有人的許可。換句話說,使用原始頭像進行衍生創作仍可能涉及原始作品的著作權問題。根據台灣《著作權法》,照片作為攝影作品,享有著作權保護。未經著作權人同意,使用他人照片來生成AI圖像,可能構成著作權侵權,
- 倫理考量:使用他人的頭像生成AI圖片,尤其是未經對方同意,可能被認為是不道德的行為。這樣的行為可能會引發道德爭議,並損害您與他人的信任關係。
為了避免侵犯他人權益,應該要在使用他人照片進行AI生成圖像前,務必取得當事人、著作權人的明確授權,以避免侵權行為。
推薦學習:ITS AI人工智慧國際認證培訓班