種類
影像識別種類, 其實分為二種
1. 圖片識別
2. 影片識別
差異
圖片跟影像的識別, 其實沒什麼差別. 就在短時間(一秒)內, 分析一張圖片, 或者分析30張圖片
一秒分析1張, 跟分析30張, 並不是30倍的差異. 因為這不止分析, 還有儲存資料到資料庫, 多圖多資料演算法. 所以圖片與影像的識別效能, 遠大於 30倍的時間
總結:
沒有高效能的電腦, 就別想作影像視別. 因為影像判別, 都需秒殺.
如何取得資料
以前講述的爬蟲, 或是現在的識別系統, 都只有一件事~~取得資料
所以, 影像或圖片識別, 就是將圖或影像轉成資料, 儲存, 然後分析
講穿了, 就是如何取得資料
所以呢
識別系別, 首要任務, 就是如何取得資料
一階與二階
電腦視覺物件偵測中,一般都是先用特殊演算法選取物件,然後再進行辨識。
特殊演算法選取物件的過程,我們稱為 Region Proposal(區域提案)。常用到的方法如Selective Search等等。
待選出物件後,對此區域擷取相關特徵並加以分類,然後再針對此區域進行物件辨識。這種需要先找出Region Proposal然後再做辨識的做法通常就稱為二階學習法(two stage learning)。
二階學習法有個重大問題, 就是一張圖在一階時,提了太多的案件,比如提了1000個案件,那麼接下來就要開始辨識系統囉。如果一個案件要辨識要0.1秒,那一千個案件不就要~~~100秒了。
除非你用一個很強的GPU平行運算,那還可能減低運算時間,但如果是手機這類型的算法幾乎沒辦法做到即時運算,因此才有one stage的方法。