【AI60問】Q45什麼是影像辨識?

by 提拔我園丁
緯育TibaMe AI小教室-Q45什麼是影像辨識?

影像辨識,「將影像輸入至分析的儀器中來進行影像分析,廣泛應用在影像監控系統。」而透過影像分析設定,可以針對入侵者、移動物體、火焰、煙霧…等進行特殊事件觸發設定,具有提早預警的效果。

我們的終極目標就是教導機器能夠像人⼀樣理解所見之物,像是:識別物品、辨認人臉、推論物體的幾何形態,從中理解其中的關聯、情緒、動作及意圖。 那電腦要達成這個目標的第一步,就是教它如何辨別物品。

舉例來說,貓咪是由⼀些幾何圖形和顏色所組成的,過去人類使用數學語言告知電腦演算方法,貓就是有圓圓的臉、胖胖的身體、兩個尖尖的耳朵和⼀條長尾巴。但若貓咪改變造型,全身捲起來,就要在原本的模型上加入新的形狀、不同的視野角度。但若貓迷事躲藏的?我們發現,即使像是貓這樣的家庭寵物,也會有相對於原型以外、數也數不清的其他形態表徵, 而這只是其中⼀樣。

👉 動手實作 OpenCV ,學會影像辨識新視界多種應用

使丹佛大學教授、前Google雲端人工智慧暨機器學習首席科學家李飛飛,透過一個簡單而深刻的觀察,改變這個想法。

李飛飛發現沒有人教導孩童如何去「看」世界,尤其在孩童發育階段,他們是直接從真實世界的經驗中來學習,到三歲左右的年紀時,孩童已經看過世界中數以萬計的照片。大量的訓練範例,讓李飛飛知道應該使用「孩童學習經驗法則」,兼顧質與量,提供訓練的資料給電腦,不再是過往的追求更好的程式演算。

經過上述的觀察,李飛飛認為要蒐集大量資料群,於是她和普林斯頓大學的李凱教授於2007年開始ImageNet專案。而2009年時,ImageNet已經是個擁有涵蓋了2萬2千種不同類別,多達150億幅圖像的資料庫。

ImageNet的資料可以教育電腦,結果李飛飛發現:ImageNet所提供的豐富資訊恰巧與機器學習演算的其中⼀門特定領域相合,就是在1970及1980年代,辛頓(Geoff Hinton)和勒丘恩(Yann LeCun)等學者所提出,著名的「卷積神經網絡」(Convolutional Neural Network,CNN) 。

*想了解CNN,請看Q42什麼是卷積神經網路 Convolutional Neural Networks, CNN?

卷積神經網路CNN在大家的意料之外,開花結果。在一般的神經網路中,會使用作訓練的物品便是模型有2400萬個節點、1億4000萬個參數、150億個連結。如同人的大腦是由無數個緊密連結的神經元所阻,而神經網路的基本運作單位是一個類神經元的節點。

ImageNet的運作方式是從別的節點得到資料,再傳給其他節點,這些節點擁有層層的組織架構,好像人的大腦⼀樣。現在,電腦不僅能告訴我們圖中有隻貓,還能告訴我們貓在哪裡。

圖 45-1 圖像自動輸入到 CNN 卷積神經網路模型,自動習得特徵與分類物件種類

視覺始於眼睛,但真正使它有用的,卻是大腦。

有時候,若電腦不確定自己所見到的東西時, 但人已經將它訓練到可以給出一個安全答案,它就能做到跟常人一樣。但有些時候,電腦運算竟可以精準辨識出物體品項,如:製造商、型號、車子年份…。

但我們只是礁島電腦辨識物品,像小孩學習講話一樣,下一波指標性則是運用「溝通」。因此,已經不會用「這是貓」來描述圖片,而是會聽到這個小孩說:「這是躺在床上的貓。」因此,要教導電腦看到圖並說出句子, 必須進⼀步地仰賴龐大資料群以及機器的學習演算。

現在,電腦不只要學習圖片辨識,還要學習人類自然的說話方式,如同大腦要結合視覺和語言⼀樣。⼀個模型可以連結不同的可視物體,就像視覺片段⼀樣,並附上句子用的字詞和片語。

目前已經有人工智慧專家群,做出了第⼀個電腦版的模型,它可以在初次看到照片時,說出跟人類似的自然語句。這是第⼀次人類的眼睛不是唯⼀可以用來思考和探索世界的工具,不只可以利用機器的智慧,更能運用許多想像不到的方式合作。

這是李飛飛想追求的目標:「給予機器智慧之眼, 為整個世界創造更美好的未來。」

影像識別的基本原理,包含:

  • 影像於電腦中的形式:儲存格式、讀取及寫入、像素運算…
  • 影像處理方法:影像去雜訊、影像品質增強、影像重採樣…
  • 影像前處理:影像二值化 、閾值分析、影像去雜訊、影像模糊、影像強化、影像縮放、色彩空間轉換…等
  • 數位電腦視覺 :影像特徵提取、特徵強化、輪廓萃取、卷積運算、型態學運算、分水嶺演算法、距離轉換…原理應用

👉 動手實作影像分類、物件偵測、影像分割與人臉生成等應用

想成為爬蟲工程師 、資料分析師 、資料工程師 、資料分析領域專家 、人工智慧產品經理嗎?還是你的公司正需要培養此領域人才呢?

點我了解 AI資料科學家-三階段全方位學程班 👉 https://www.tibame.com/eventpage/ai_datascientist 

每日5分鐘, 提拔我園丁陪你快速添補AI/資料科學知識與技能。

若想了解更多AI/資料科學的小知識、及各產業的相關應用,歡迎訂閱TibaMe FB及部落格,或有其他想了解的主題歡迎在下方留言讓我們知道唷!

參考資料

分享這篇文章:
0 comment
5

您也許會喜歡

Leave a Comment

這個網站採用 Akismet 服務減少垃圾留言。進一步瞭解 Akismet 如何處理網站訪客的留言資料