技術乾貨 | 遙感圖像分類方法綜述

開運集團 發佈 2022-05-20T13:54:33.370544+00:00

遙感圖像分類主要是根據地面物體電磁波輻射在遙感圖像上的特徵,判斷識別地面物體的屬性,進而為目標檢測與識別等其他應用提供輔助信息,也可以作為最終結果提供基礎地理信息用於地圖繪測、搶險救災、軍事偵察等領域。

航天遙感技術是一種通過衛星對地觀測獲取遙感圖像信息數據的技術,這些圖像數據在各領域都發揮著不可或缺的作用。遙感圖像分類主要是根據地面物體電磁波輻射在遙感圖像上的特徵,判斷識別地面物體的屬性,進而為目標檢測與識別等其他應用提供輔助信息,也可以作為最終結果提供基礎地理信息用於地圖繪測、搶險救災、軍事偵察等領域。遙感圖像分類是遙感技術應用的一個重要環節。

在過去的幾十年裡,各方面學者對遙感圖像的分類有著諸多研究,提出了許多分類方法,按是否需要選取標記樣本可將分類方法分為監督分類和非監督分類。根據最小分類單元可將分類方法分為基於像元的分類、基於對象的分類,以及基於混合像元分解的分類。此外,不同類型的遙感圖像(多光譜遙感圖像、高光譜遙感圖像、合成孔徑雷達圖像) 分類方法也不盡相同。由於目標分類通常是在特徵空間中進行的,因此特徵的表達與學習是實現目標分類的關鍵。根據表達和學習特徵的方式,可將現有的遙感圖像分類方法大致分為三類: 基於人工特徵描述的分類方法、基於機器學習的分類方法和基於深度學習的分類方法。需要注意的是,這三類方法並沒有嚴格的區分界線,相互之間互有重疊和借鑑。

基於人工特徵描述的分類方法

早期的圖像分類主要是基於人工提取的圖像特徵進行分類。這些方法主要是依靠有大量專業領域知識和實踐經驗的專家來設計各種圖像特徵,例如顏色、形狀、紋理、光譜信息等等,這些特徵包含了大量可用於目標分類的有用信息。幾個最具代表性的人工描述特徵包括顏色直方圖、紋理特徵、方向梯度直方圖和尺度不變特徵變換。

(1)顏色直方圖

顏色直方圖( Color histograms)能簡單描述一幅圖像中顏色的分布,即不同顏色在整個圖像中所占的比例,是圖像檢索和圖像分類中常用的視覺特徵。顏色直方圖易於計算,且具有很好的平移和旋轉不變性。其缺點在於無法描述圖像中顏色的分布及每種色彩所處的空間位置,即不能傳達空間信息。此外,顏色直方圖對光照變化和量化誤差也很敏感。

(2)紋理特徵

紋理特徵( Texture features) 也是一種全局特徵,描述了圖像或圖像區域所對應目標的表面性質。其中灰度共生矩陣( GLCM) ,Gabor 特徵和局部二值模式( Local binary patterns LBP) 等被廣泛應用於遙感圖像分類。紋理特徵對於識別具有明顯紋理特徵的目標圖像非常有用。其主要缺點在於當圖像的解析度、目標光照情況發生變化時,目標圖像紋理可能會產生較大偏差,影響分類效果。

(3)方向梯度直方圖

方向梯度直方圖( Histogram of OrientedGradient,HOG) 是一種圖像局部紋理特徵。它通過計算和統計圖像局部區域的方向梯度直方圖構成圖像特徵,由於 HOG 是在圖像的局部區域操作,因此它對圖像幾何形變和光照變化能保持較好的不變性,它已經在許多圖像分類任務中取得了巨大的成功。其缺點在於計算過程冗長,對噪點特別敏感。

(4)尺度不變特徵變換

尺度不變特徵變換 ( Scale-invariant featuretransform,SIFT),是一種局部特徵描述子,它通過確定關鍵點周圍的梯度信息描述子區域。SIFT 特徵檢測的主要步驟是: a尺度空間極值檢測,通過微分函數識別圖中興趣點; b關鍵點定位,在候選位置上確定模型和尺度; c方向確定,根據圖像的局部梯度,為每個關鍵點分配一個或多個方向; d關鍵點描述,在關鍵點的鄰域內測量圖像的局部梯度,進而生成相應特徵描述。提取的特徵將用於目標分類與識別。SIFT 所提取的圖像特徵是局部特徵,具有尺度和旋轉不變性,對亮度變化、視角變化、仿射變化及噪聲也有一定程度的穩定性。當特徵點不多時,算法處理速度也相對較快,適於在海量特徵數據中進行快速、準確的匹配。但 SIFT 是一種只利用到 灰度性質的算法,無法識別圖像的色彩信息。當目標圖像形狀相似時,分類錯誤率較高。

基於人工特徵描述的分類方法具有直觀、易於理解的優點。顏色直方圖和紋理特徵描述了整個目標圖像在特定方面的統計學特性,因而可以直接輸入分類器用於目標分類。而 HOG 特徵和 SIFT 描述子通常用來作為構建全局圖像特徵的構建塊,例如視覺詞袋( Bag-of-Visual-Words,BoVW) 模型和基於 HOG 特徵塊的模型。以上方法在一定程度上解決了遙感圖像分類問題。隨著遙感技術的迅速發展,遙感圖像解析度越來越高,圖像中大量細節的出現使得單一特徵難以全面表達目標對象,多特徵融合的方法開始用於遙感圖像分類。多特徵融合的方法對改善分類效果有所幫助,但如何有效組合特徵以使分類效果最優仍未解決。此外,基於人工特徵描述的分類方法特徵的設計依賴於相關專業知識和經驗,在面對複雜圖像時,這些特徵的描述能力十分有限。

基於機器學習的遙感圖像分類方法

近年來,建立在概率統計基礎上的機器學習為遙感圖像分類提供了許多可行方法。典型的機器學習方法包括支持向量機、決策樹、主成分分析法、k均值聚類和稀疏表示等。

(1)支持向量機

支持向量機( Support Vector Machine,SVM) 是一種監督學習方法,它通過引入核函數的概念在高維特徵空間解算最優化問題,進而尋找最優分類超平面,解決複雜數據分類問題。近年來在遙感圖像識別分類問題中有著較多的應用。在實際應用中,SVM 具有穩定、易用等特點,但其在解決多類目標分類問題中表現較差,如何正確選擇核函數也沒有相關的理論依據。

(2)決策樹

決策樹( Decision Tree) 是一種歸納推理的分類方法,通過對圖像光譜、顏色、空間等信息定義規則,從中心節點出發,對圖像各類信息值進行比較,得出新的分支,通過更新規則得到新的決策樹,直到滿足分類要求,最終的節點即為分類結果。近年來有基於決策樹算法改進的隨機森林模型以及 CART 決策樹陸續用於遙感圖像分類。決策樹算法易於理解,可操作性高,能夠處理多輸出問題。其缺點在於泛化能力太差,在處理高維數據時表現不佳。

決策樹原理

(3)主成分分析法

主成分分析法( Principal Components Analysis,PCA) 通過一個線性變化把目標數據變換轉成另一組不相關的變量,並將新的變量按照方差依次遞減的順序排列。主成分分析法通過保留低階主成分,忽略高階主成分做到減少數據的維數,保存了數據中對方差貢獻最大的特徵。該算法是一種無監督訓練的簡單模型,能夠學習到用於多類圖像分類任務的不變特徵進而進行目標分類。其缺點在於 PCA 是線性運算,無法獲得更多的抽象表示,因而其特徵的描述能力是有限的。

(4)k 均值聚類

k 均值聚類( K-means) 是一種矢量化方法,旨在將一組數據項劃分為 k 個集群,並將相似的對象歸到同一個集群中。該算法運算步驟如下: a 隨機生成 k 個初始點作為質心; b 將數據集中的數據按照距離質心的遠近分到各個群集中; c 將各個集群中的數據求平均值,作為新的質心,重複上一步,直到所有的集群不再改變時終止。由於其簡單性,K-means 被廣泛用於無監督的遙感圖像分類。K-means 算法易於理解,複雜度低,能夠在短時間內處理海量的數據,聚類效果尚可。缺點在於對噪聲和離群點敏感,在算法運行前需要先確認 K 值,但目前並沒有明確理論指導確定 K 值,而且其分類結果不一定是全局最優值。

(5)稀疏表示

稀疏表示( Sparserepresentation) 是一種無監督學習方法,其目的是在給定的超完備字典中用儘可能少的原子表示圖像信號,從而獲得圖像更為簡潔的特徵表示,方便對圖像進行分類處理。在實際應用中,稀疏表示具有計算速度快、自適應性強以及能高性能表示結果等優點。其主要難點在於如何構建完備字典。

在實際應用中,上述基於機器學習的分類方法在遙感圖像分類任務中取得了良好的效果,尤其是與基於人工特徵描述的分類方法相比。但隨著遙感技術的進步,遙感圖像信息呈現海量增長的趨勢,目標樣本的數量和多樣性也急劇增加,上述機器學習的分類方法屬於淺層學習網絡,很難建立複雜的函數表示,不能適應複雜樣本的遙感圖像分類。

基於深度學習的遙感圖像分類方法

深度學習( deep learning) 作為機器學習算法中的一個新興技術,其動機在於建立模擬人腦進行分析學習的神經網絡,它能通過海量的訓練數據和具有很多隱藏層的深度模型學習更有用的特徵,最終提升分類的準確性。近年來深度學習在圖像分類應用中取得了令人矚目的成績,越來越多的學者開始將深度學習應用於遙感圖像處理中。幾種常用的深度學習方法包括自動編碼器、卷積神經網絡、深度信念網絡和針對小訓練樣本的遷移學習。

1) 自動編碼器

自動編碼器( AutoEncoder,AE)是一種無監督的學習算法,主要用於數據的降維或者特徵的提取。這種算法的思想是將神經網絡的隱藏層看成是編碼器和解碼器。編碼器將圖像數據映射到特徵空間,解碼器將數據映射回數據空間,從而對輸入數據進行重構。自動編碼器非常適合處理高維數據,在樣本數較多的情況下,分類效果明顯高於 SVM 等傳統分類方法。近年來已成功應用於圖像分類,特別是基於自動編碼器改進的去噪自編碼器( DAE)和棧式自編碼器 SAE,在遙感圖像分類任務中取得了良好的分類效果。自動編碼器的缺點在於模型的泛化能力較差,即當測試樣本和訓練樣本不符合同一分布時,分類效果欠佳。

(2)卷積神經網絡

卷積神經網絡( Convolutional Neural Network,CNN)是模仿人類視覺大腦皮層機理建立的網絡。一個典型的 CNN 由輸入層、卷積層( Convolutional Layer)、池化層( Pooling Layer)和全連接層( Full Connected Layer)、輸出層構成,CNN的下層通常學習基本特徵,隨著網絡深度的增加,特徵變得更加複雜並且被分層構建。全連接層在 CNN 網絡的末端,從前層的分層輸出中學習複雜的非線性函數提取抽象特徵,最終通過一個分類器進行分類。近年來,CNN 在圖像分類處理領域取得了巨大的成功。比較成熟的 CNN 模型包括 AlexNet、VGG、GoogleNet、ResNet 等。CNN 在遙感圖像分類中也有著廣泛的應用。CNN 的主要缺點在於需要大數據量的訓練集來學習確定各層網絡參數。同時,隨著網絡層數的增加,容易出現局部最優及過擬合。

(3)深度信念網絡

深度信念網絡(Deep Belief Network,DBN) 由 Hinton 等人提出。它由多個受限玻爾茲曼機(Restricted Boltzman Machine,RBM 一種可以用來對各種數據進行建模的概率生成模型,基本功能與 AE 類似) 和反向傳播( BP) 網絡組成。DBN通過訓練其神經元間的權重,可以讓整個神經網絡按照最大概率生成訓練數據。其訓練過程是採用非監督方式自下而上通過每層的RBM 學習無標籤樣本提取圖像特徵,在 DBN 的最後一層連接一個分類器,接收RBM 的輸出特徵向 量作為它的輸入特徵向量,有監督地訓練分類器,最後用反向傳播算法微調整個 DBN,以達到一個較好的分類水平。

DBN 通過對各RBM 層進行單獨訓練完成整個網絡的訓練,提升了網絡的訓練速度,使系統對複雜數據分類問題的處理能力有較大提升,並且克服了直接對深度神經網絡進行訓練時容易出現局部最優等問題。DBN 在多項遙感圖像分類實驗中分類精度達到 80% 以上。DBN 的缺點在於模型不能明確不同類別之間的最優分類面,所以在分類任務中,分類精度可能沒有判別模型高,此外 DNB 還要求輸入數據具有平移不變性,並且不適當的參數選擇會導致學習收斂於局部最優解。


(4)遷移學習

遷移學習是指將一個分類問題上訓練好的模型經過調整和優化使其能適用於另一個分類問題。深度學習網絡的訓練需要大量的訓練樣本,目前常見的幾個遙感圖像數據集包括 Indian pines、kennedy Space Center、Pavia City Center、Salinas等。隨著網絡的加深加寬,這些數據集的分類精度趨於飽和,逐漸不能滿足訓練要求。遷移學習旨在解決訓練數據不足的問題,近年來,有學者利用遷移學習解決遙感圖像數據集不足的問題。但當傳感器類型發生變化或者成像區域不同時,分類效果極差。

深度學習的出現,顯著地提升了遙感圖像分類的效果。一方面,與需要大量專業知識和經驗的人工特徵描述的分類方法相比,深度學能通過深層架構自動學習數據特徵,這是深度學習方法的關鍵優勢; 另一方面,與常用的淺層機器學 習模型相比,由多個處理層組成的深度學習模型可以學習到更強大的具有多個抽象層次的數據特徵,這些抽象的深層特徵更適用於語義級別的目標分類。隨著計算機計算能力的進步,深度學習網絡結構往更深、更寬方向發展,但如何選擇合適的網絡結構和參數以達到最優的分類效果仍是亟待解決的問題,對各隱藏層提取的抽象特徵的物理含義也缺乏明確的解釋,同時,缺乏有效的訓練數據集也是制約分類精度提升的瓶頸。

基於人工特徵描述的分類方法在早期為遙感圖像的分類提供了解決方案,隨後建立在概率統計基礎上的機器學習進一步提高了分類精度。深度學習出現,使人們不再需要完全依賴人類專家去設計特徵,並且使分類精度有了質的飛躍,但深度網絡建模可視化困難和數據集的缺乏制約了分類精度的進一步提高。未來將更加快速準確地確定深度學習的網絡結構和參數。在實際應用中,深度學習系統的深度和寬度對分類效果有明顯的影響,更深更寬的網絡可以挖掘出數據中更為抽象的特徵表示,提高分類效能,但過大的網絡模型又會增大訓練消耗,降低訓練效率,還可能會降低網絡的泛化性,出現過擬合的現象。如何在保證分類效果的同時有效地縮減網絡的複雜度,也是當前研究的熱點之一。隨著科技的進步,各類型數據呈現海量增長的趨勢,也可以考慮將多類型傳感器、智能終端、社交網站等多源異構數據融合進行遙感圖像分類處理。多源異構數據能夠能從不同的方面提供目標圖像特徵和信息。不同特徵和信息的融合,既保留了參與融合的多特徵的有效鑑別信息,又在一定程度上避免了單一數據的不確定性,令分類結果更加可靠,使遙感圖像目標分類的結果更加全面準確。


關鍵字: