在計算機視覺中,關於圖像識別有以下4大類型任務:
- 分類—Classification:解決「是什麽?」的問題,即給定一張圖片或一段影片判斷裡面包含什麽類別的目標。
- 定位—Location:解決「在哪裡?」的問題,即定位出這個目標的的位置。
- 檢測—Detection:解決「是什麽?在哪裡?」的問題,即定位出這個目標的的位置,且知道目標物是什麽。
- 分割—Segmentation:分爲實例的分割(Instance-level)和場景分割(Scene-level),解決「每個圖元屬於哪個目標物或場景」的問題。
物體檢測的任務是找出影象或影片中的感興趣物體,同時檢測出它們的位置和大小,是機器視覺領域的核心問題之一。
物體檢測過程中有很多不確定因素,如:影像中物體數量不確定,物體會有不同的外觀、形狀、姿態,加上物體成像時會有光照、遮擋等因素的干擾,導致檢測演算法有一定的難度。
一直以來,深度學習的物體檢測發展,主要集中在兩個方向:
- one stage演算法
直接在網路中提取特徵來預測物體分類和位置。
如:YOLO、SSD。 - two stage演算法
需要先生成proposal(可能包含待檢物體的預選框),再進行粒度的物體檢測。
如:R-CNN系列。
【推薦學習】
結帳輸入優惠碼「BLOGONLY200」,購買上述任一線上課程現折$200!
想成為爬蟲工程師 、資料分析師 、資料工程師 、資料分析領域專家 、人工智慧產品經理嗎?還是你的公司正需要培養此領域人才呢?
點我了解 AI資料科學家全方位學程 👉 https://bit.ly/3o4N39e
每日5分鐘, 提拔我園丁陪你快速添補AI/資料科學知識與技能。
若想了解更多AI/資料科學的小知識、及各產業的相關應用,歡迎訂閱TibaMe FB及部落格,或有其他想了解的主題歡迎在下方留言讓我們知道唷!
參考資料