CN / EN
banner圖
掌握核心技術 駕馭光的運用

技術文章

Technical Articles

計算機視覺技術的圖像處理方法

日期:2020-04-21 來源:J9九游会中国

計算機視覺係統中,視覺信息的處理技術主要依賴於圖像處理方法,它包括圖像增強、數據編碼和傳輸、平滑、邊緣銳化、分割、特征抽取、圖像識別與理解等內容。經過這些處理後,輸出圖像的質量得到相當程度的改善,既改善了圖像的視覺效果,又便於計算機對圖像進行分析、處理和識別。

計算機視覺技術的圖像處理方法_sdyinshuo.com
圖像的增強

圖像的增強用於調整圖像的對比度,突出圖像中的重要細節,改善視覺質量。通常采用灰度直方圖修改技術進行圖像增強。圖像的灰度直方圖是表示一幅圖像灰度分布情況的統計特性圖表,與對比度緊密相連。通過灰度直方圖的形狀,能判斷該圖像的清晰度和黑白對比度。如果獲得一幅圖像的直方圖效果不理想,可以通過直方圖均衡化處理技術作適當修改,即把一幅已知灰度概率分布圖像中的像素灰度作某種映射變換,使它變成一幅具有均勻灰度概率分布的新圖像,實現使圖像清晰的目的。
圖像的平滑

圖像的平滑處理技術即圖像的去噪聲處理,主要是為了去除實際成像過程中因成像設備和環境所造成的圖像失真,提取有用信息。眾所周知,實際獲得的陶像在形成、傳輸、接收和處理的過程中,不可避免地存在著外部幹擾和內部幹擾,如光電轉換過程中敏感元件靈敏度的不均勻性、數字化過程的量化噪聲、傳輸過程中的誤差以及人為因素等.均會使圖像變質。因此,去除噪聲,恢複原始圖像是圖像處理中的一個重要內容。
圖像的數據編碼和傳輸

數字圖像的數據量是相當龐大的,一幅512。512個像素的數字圖像的數據量為256 K字節,若假設每秒傳輸25幀圖像,則傳輸的信道速率為52.4M比特/秒。高信道速率意味瞢高投資,也意味著普及難度的增加,因此。傳輸過程中,對圖像數據進行壓縮顯得非常重要。數據的壓縮主要通過圖像數據的編霄和變換壓縮完成。圖像數據編碼一般采用預測編碼.即將圖像數據的空間變化規律和序列變化規律用一個預測公式表示.如果知道了,某一像素的前麵各相鄰像素值之後.可以用公式預測該像素值。該方法可將一幅圖像的數據壓縮到為數不多的幾十個特傳輸,在接收端再變換回去即可。
邊緣銳化

圖像邊緣銳化處理主要是加強圖像中的輪廓邊緣和細節,形成完整的物體邊界.達到將物體從圖像中分離出來或將表示同一物體表麵的區域檢測出來的目的。它是早期視覺理論和算法中的基本問題.也是中期和後期視覺成敗的重要因素之一。
圖像的分割

圖像分割是將圖像分成若幹部分,每一部分對應於某一物體表麵.在進行分割時.每一部分的灰度或紋理符合某一種均勻測度度量。某本質是將像素進行分類。分類的依據是像素的灰度值、顏色、頻譜特性、空間特性或紋理特性等。圖像分割是圖像處理技術的基本方法之一,應用於諸如染色體分類、景物理解係統、機器視覺等方麵。圖像分割主要有兩種方法:一是鑒於度量宅問的灰度閭值分割法。它是根據圖像灰度直方圖來決定圖像空間域像素聚類。二是空間域區域增長分割方法。它是對在某種意義上(如灰度級、組織、梯度等)具有相似性質的像素連通集構成分割區域,該方法有很好的分割效果,但缺點是運算複雜.處理速度慢。
數據驅動的分割

常見的數據驅動分割包括基於邊緣檢測的分割、基於區域的分割、邊緣與區域相結合的分割等。對於基於邊緣檢測的分割,其基本思想是先檢測圖像中的邊緣點,再按一定策略連接成輪廓,從而構成分割區域。難點在於邊緣檢測時抗噪聲性能和檢測精度的矛盾,若提高檢測精度,則噪聲產生的偽邊緣會導致不合理的輪廓;若提高抗噪聲性能,則會產生輪廓漏檢和位置偏差。為此,人們提出各種多尺度邊緣檢測方法,根據實際問題設計多尺度邊緣信息的結合方案,以較好地兼顧抗噪聲性能和檢測精度。

基於區域的分割的基本思想是根據圖像數據的特征將圖像空間劃分成不同的區域。常用的特征包括:直接來自原始圖像的灰度或彩色特征;由原始灰度或彩色值變換得到的特征。方法有閾值法、區域生長法、聚類法、鬆弛法等。

邊緣檢測能夠獲得灰度或彩色值的局部變化強度,區域分割能夠檢測特征的相似性與均勻性。將兩者結合起來,通過邊緣點的限製,避免區域的過分割;同時通過區域分割補充漏檢的邊緣,使輪廓更加完整。例如,先進行邊緣檢測與連接,再比較相鄰區域的特征(灰度均值、方差),若相近則合並;對原始圖像分別進行邊緣檢測和區域生長,獲得邊緣圖和區域片段圖後,再按一定的準則融合,得到最終分割結果。
模型驅動的分割

常見的模型驅動分割包括基於動態輪廓模型、組合優化模型、目標幾何與統計模型。動態輪廓模型用於描述分割目標的動態輪廓。由於其能量函數采用積分運算,具有較好的抗噪聲性,對目標的局部模糊也不敏感,因而適用性很廣。但這種分割方法容易收斂到局部最優,因此要求初始輪廓應盡可能靠近真實輪廓。

近年來對通用分割方法的研究傾向於將分割看作一個組合優化問題,並采用一係列優化策略完成圖像分割任務。主要思路是在分割定義的約束條件之外,根據具體任務再定義一個優化目標函數,所求分割的解就是該目標函數在約束條件下的全局最優解。以組合優化的觀點處理分割問題,主要是利用一個目標函數綜合表示分割的各種要求和約束,將分割變為目標函數的優化求解。由於目標函數通常是一個多變量函數,可采用隨機優化方法。

基於目標幾何與統計模型的分割是將目標分割與識別集成在一起的方法,常稱作目標檢測或提取。基本思想是將有關目標的幾何與統計知識表示成模型,將分割與識別變為匹配或監督分類。常用的模型有模板、特征矢量模型、基於連接的模型等。這種分割方法能夠同時完成部分或全部識別任務,具有較高的效率。然而由於成像條件變化,實際圖像中的目標往往與模型有一定的區別,需要麵對誤檢與漏檢的矛盾,匹配時的搜索步驟也頗為費時。
圖像的識別

圖像的識別過程實際上可以看作是一個標記過程,即利用識別算法來辨別景物中已分割好的各個物體.給這螳物體賦予特定的標記,它是汁算機視覺係統必須完成的一個任務。按照網像識別從易到難.可分為幾類問題?第一類識別問題中.圖像中的像素表達了某一物體的某種特定信息。第二類問題中,待識別物是有形的整體。二維圖像信息已經足夠識別該物體.如文字識別、某些具有穩定可視表麵的三維體識別等。第三類問題是由輸入的二維圖、要素圖、2x5維圖等.得出被測物體的三維表示。這裏存著如何將隱含的三維信息提取出來的問題.當是今研究的熱點。

目前用於圖像識別的方法主要分為決策理論和結構方法。決策理論方法的基礎是決策函數,利用它對模式向量進行分類識別.是以定時描述(如統計紋理)為基礎的:結構方法的核心是將物體分解成』'模式或模式基元,而不同的物體結構有不同的基元串(或稱字符串),通過對未知物體利用給定的模式基元求出編碼邊界,得到字符串,冉根據字符串判斷它的屬類。這是一種依賴於符號描述被測物體之間關係的方法。


返回列表