

圖4-5則是以貓和狗為識(shí)別目標(biāo)的一個(gè)圖像識(shí)別系統(tǒng)。系統(tǒng)需要一些貓和狗的圖像,通過(guò)這些圖像學(xué)習(xí)出貓和狗各自的特征(例如貓和狗的輪廓不一樣),再通過(guò)對(duì)貓狗特征的學(xué)習(xí)獲得能夠分辨貓狗的分類(lèi)器。在訓(xùn)練好貓狗分類(lèi)器以后,當(dāng)有新的貓或者狗的圖像輸入到系統(tǒng)時(shí),系統(tǒng)首先將圖像轉(zhuǎn)換成特征,然后使用已經(jīng)學(xué)習(xí)好的貓狗分類(lèi)器就能自動(dòng)識(shí)別出是貓還是狗。需要注意的是,系統(tǒng)只能對(duì)已經(jīng)學(xué)習(xí)過(guò)的類(lèi)別進(jìn)行識(shí)別。例如,識(shí)別系統(tǒng)只訓(xùn)練學(xué)習(xí)了狗和貓的圖像,那么該系統(tǒng)只能識(shí)別狗和貓的圖像。如果你給這個(gè)系統(tǒng)一只狐貍的圖像,該系統(tǒng)則無(wú)法識(shí)別。
通常,輸入的原始圖像有太多冗余的信息,而這些信息不是分類(lèi)所必需的。因此,圖像分類(lèi)的第一步是通過(guò)提取包含在圖像中的重要信息并舍棄其余部分來(lái)簡(jiǎn)化圖像。例如,我們可以通過(guò)使用邊緣檢測(cè)器,將圖像中物體的邊緣信息提取出來(lái)。該步驟稱為特征提取。在傳統(tǒng)的計(jì)算機(jī)視覺(jué)方法中,設(shè)計(jì)這些特征對(duì)算法的性能是至關(guān)重要的。除了簡(jiǎn)單的邊緣特征以外,我們可以進(jìn)一步提取其它更有用的特征。常用的圖像特征包括Haar特征、HOG(Histogram of Oriented Gradients)特征、SIFT(Scale-Invariant Feature Transform)特征、SURF特征(Speeded Up Robust Feature)等。一旦獲取了圖像特征,我們就可以通過(guò)前面章節(jié)所學(xué)的分類(lèi)學(xué)習(xí)方法對(duì)圖像進(jìn)行分類(lèi)。圖像識(shí)別常用的分類(lèi)學(xué)習(xí)方法主要包括支持向量機(jī)、最近鄰分類(lèi)器、人工神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等。

