數(shù)字圖像處理和邊緣檢測-中文翻譯
《數(shù)字圖像處理和邊緣檢測-中文翻譯》由會員分享,可在線閱讀,更多相關(guān)《數(shù)字圖像處理和邊緣檢測-中文翻譯(4頁珍藏版)》請在裝配圖網(wǎng)上搜索。
中文譯文數(shù)字圖像處理和邊緣檢測1.數(shù)字圖像處理數(shù)字圖像處理方法的研究源于兩個主要應(yīng)用領(lǐng)域:為便于人們分析而對圖像信息進行改進;為使機器自動理解而對圖像數(shù)據(jù)進行存儲、傳輸及顯示。一幅圖像可定義為一個二維函數(shù) ,這里 x 和 y 是空間坐標(biāo),而在任何一對空間坐標(biāo)(,)fxy上的幅值 f 稱為該點圖像的強度或灰度。當(dāng) 和幅值 f 為有限的、離散的數(shù)值時,則圖像為(,)xy ,數(shù)字圖像。數(shù)字圖像處理是指借用數(shù)字計算機處理數(shù)字圖像,值得提及的是數(shù)字圖像是由有限的元素組成的,每一個元素都有一個特定的位置和幅值,這些元素稱為圖像元素、畫面元素或像素。像素是廣泛用于表示數(shù)字圖像元素的詞匯。視覺是人類最高級的感知器官,所以,毫無疑問圖像在人類感知中扮演著最重要的角色。然而,人類感知只限于電磁波譜的視覺波段,成像機器則可覆蓋幾乎全部電磁波譜,從伽馬射線到無線電波。它們可以對非人類習(xí)慣的那些圖像源進行加工,這些圖像源包括超聲波、電子顯微鏡及計算機產(chǎn)生的圖像。因此,數(shù)字圖像處理涉及各種各樣的應(yīng)用領(lǐng)域。圖像處理涉及的范疇或其他相關(guān)領(lǐng)域(例如,圖像分析和計算機視覺)的界定在初創(chuàng)人之間并沒有一致的看法。有時用處理的輸入和輸出內(nèi)容都是圖像這一特點來界定圖像處理的范圍。我們認為這一定義僅是人為界定和限制。例如,在這個定義下,甚至最普通的計算一幅圖像灰度平均值的工作都不能算做是圖像處理。另一方面,有些領(lǐng)域(如計算機視覺)研究的最高目標(biāo)是用計算機去模擬人類視覺,包括理解和推理并根據(jù)視覺輸入采取行動等。這一領(lǐng)域本身是人工智能的分支,其目的是模仿人類智能。人工智能領(lǐng)域處在其發(fā)展過程中的初期階段,它的發(fā)展比預(yù)期的要慢的多,圖像分析(也稱為圖像理解)領(lǐng)域則處在圖像處理和計算機視覺兩個學(xué)科之間。從圖像處理到計算機視覺這個連續(xù)的統(tǒng)一體內(nèi)并沒有明確的界線。然而,在這個連續(xù)的統(tǒng)一體中可以考慮三種典型的計算處理(即低級、中級和高級處理)來區(qū)分其中的各個學(xué)科。低級處理涉及初級操作,如降低噪聲的圖像預(yù)處理,對比度增強和圖像尖銳化。低級處理是以輸入、輸出都是圖像為特點的處理。中級處理涉及分割(把圖像分為不同區(qū)域或目標(biāo)物)以及縮減對目標(biāo)物的描述,以使其更適合計算機處理及對不同目標(biāo)的分類(識別) 。中級圖像處理是以輸入為圖像,但輸出是從這些圖像中提取的特征(如邊緣、輪廓及不同物體的標(biāo)識等)為特點的。最后,高級處理涉及在圖像分析中被識別物體的總體理解,以及執(zhí)行與視覺相關(guān)的識別函數(shù)(處在連續(xù)統(tǒng)一體邊緣)等。根據(jù)上述討論,我們看到,圖像處理和圖像分析兩個領(lǐng)域合乎邏輯的重疊區(qū)域是圖像中特定區(qū)域或物體的識別這一領(lǐng)域。這樣,在研究中,我們界定數(shù)字圖像處理包括輸入和輸出均是圖像的處理,同時也包括從圖像中提取特征及識別特定物體的處理。舉一個簡單的文本自動分析方面的例子來具體說明這一概念。在自動分析文本時首先獲取一幅包含文本的圖像,對該圖像進行預(yù)處理,提?。ǚ指睿┳址?,然后以適合計算機處理的形式描述這些字符,最后識別這些字符,而所有這些操作都在本文界定的數(shù)字圖像處理的范圍內(nèi)。理解一頁的內(nèi)容可能要根據(jù)理解的復(fù)雜度從圖像分析或計算機視覺領(lǐng)域考慮問題。這樣,我們定義的數(shù)字圖像處理的概念將在有特殊社會和經(jīng)濟價值的領(lǐng)域內(nèi)通用。數(shù)字圖像處理的應(yīng)用領(lǐng)域多種多樣,所以文本在內(nèi)容組織上盡量達到該技術(shù)應(yīng)用領(lǐng)域的廣度。闡述數(shù)字圖像處理應(yīng)用范圍最簡單的一種方法是根據(jù)信息源來分類(如可見光、X 射線,等等) 。在今天的應(yīng)用中,最主要的圖像源是電磁能譜,其他主要的能源包括聲波、超聲波和電子(以用于電子顯微鏡方法的電子束形式) 。建模和可視化應(yīng)用中的合成圖像由計算機產(chǎn)生。建立在電磁波譜輻射基礎(chǔ)上的圖像是最熟悉的,特別是 X 射線和可見光譜圖像。電磁波可定義為以各種波長傳播的正弦波,或者認為是一種粒子流,每個粒子包含一定(一束)能量,每束能量成為一個光子。如果光譜波段根據(jù)光譜能量進行分組,我們會得到下圖 1 所示的伽馬射線(最高能量)到無線電波(最低能量)的光譜。如圖所示的加底紋的條帶表達了這樣一個事實,即電磁波譜的各波段間并沒有明確的界線,而是由一個波段平滑地過渡到另一個波段。圖像獲取是第一步處理。注意到獲取與給出一幅數(shù)字形式的圖像一樣簡單。通常,圖像獲取包括如設(shè)置比例尺等預(yù)處理。圖像增強是數(shù)字圖像處理最簡單和最有吸引力的領(lǐng)域。基本上,增強技術(shù)后面的思路是顯現(xiàn)那些被模糊了的細節(jié),或簡單地突出一幅圖像中感興趣的特征。一個圖像增強的例子是增強圖像的對比度,使其看起來好一些。應(yīng)記住,增強是圖像處理中非常主觀的領(lǐng)域,這一點很重要。圖像復(fù)原也是改進圖像外貌的一個處理領(lǐng)域。然而,不像增強,圖像增強是主觀的,而圖像復(fù)原是客觀的。在某種意義上說,復(fù)原技術(shù)傾向于以圖像退化的數(shù)學(xué)或概率模型為基礎(chǔ)。另一方面,增強以怎樣構(gòu)成好的增強效果這種人的主觀偏愛為基礎(chǔ)。彩色圖像處理已經(jīng)成為一個重要領(lǐng)域,因為基于互聯(lián)網(wǎng)的圖像處理應(yīng)用在不斷增長。就使得在彩色模型、數(shù)字域的彩色處理方面涵蓋了大量基本概念。在后續(xù)發(fā)展,彩色還是圖像中感興趣特征被提取的基礎(chǔ)。小波是在各種分辨率下描述圖像的基礎(chǔ)。特別是在應(yīng)用中,這些理論被用于圖像數(shù)據(jù)壓縮及金字塔描述方法。在這里,圖像被成功地細分為較小的區(qū)域。壓縮,正如其名稱所指的意思,所涉及的技術(shù)是減少圖像的存儲量,或者在傳輸圖像時降低頻帶。雖然存儲技術(shù)在過去的十年內(nèi)有了很大改進,但對傳輸能力我們還不能這樣說,尤其在互聯(lián)網(wǎng)上更是如此,互聯(lián)網(wǎng)是以大量的圖片內(nèi)容為特征的。圖像壓縮技術(shù)對應(yīng)的圖像文件擴展名對大多數(shù)計算機用戶是很熟悉的(也許沒注意) ,如 JPG 文件擴展名用于 JPEG(聯(lián)合圖片專家組)圖像壓縮標(biāo)準(zhǔn)。形態(tài)學(xué)處理設(shè)計提取圖像元素的工具,它在表現(xiàn)和描述形狀方面非常有用。這一章的材料將從輸出圖像處理到輸出圖像特征處理的轉(zhuǎn)換開始。分割過程將一幅圖像劃分為組成部分或目標(biāo)物。通常,自主分割是數(shù)字圖像處理中最為困難的任務(wù)之一。復(fù)雜的分割過程導(dǎo)致成功解決要求物體被分別識別出來的成像問題需要大量處理工作。另一方面,不健壯且不穩(wěn)定的分割算法幾乎總是會導(dǎo)致最終失敗。通常,分割越準(zhǔn)確,識別越成功。表示和描述幾乎總是跟隨在分割步驟的輸后邊,通常這一輸出是未加工的數(shù)據(jù),其構(gòu)成不是區(qū)域的邊緣(區(qū)分一個圖像區(qū)域和另一個區(qū)域的像素集)就是其區(qū)域本身的所有點。無論哪種情況,把數(shù)據(jù)轉(zhuǎn)換成適合計算機處理的形式都是必要的。首先,必須確定數(shù)據(jù)是應(yīng)該被表現(xiàn)為邊界還是整個區(qū)域。當(dāng)注意的焦點是外部形狀特性(如拐角和曲線)時,則邊界表示是合適的。當(dāng)注意的焦點是內(nèi)部特性(如紋理或骨骼形狀)時,則區(qū)域表示是合適的。則某些應(yīng)用中,這些表示方法是互補的。選擇一種表現(xiàn)方式僅是解決把原始數(shù)據(jù)轉(zhuǎn)換為適合計算機后續(xù)處理的形式的一部分。為了描述數(shù)據(jù)以使感興趣的特征更明顯,還必須確定一種方法。描述也叫特征選擇,涉及提取特征,該特征是某些感興趣的定量信息或是區(qū)分一組目標(biāo)與其他目標(biāo)的基礎(chǔ)。識別是基于目標(biāo)的描述給目標(biāo)賦以符號的過程。如上文詳細討論的那樣,我們用識別個別目標(biāo)方法的開發(fā)推出數(shù)字圖像處理的覆蓋范圍。到目前為止,還沒有談到上面圖 2 中關(guān)于先驗知識及知識庫與處理模塊之間的交互這部分內(nèi)容。關(guān)于問題域的知識以知識庫的形式被編碼裝入一個圖像處理系統(tǒng)。這一知識可能如圖像細節(jié)區(qū)域那樣簡單,在這里,感興趣的信息被定位,這樣,限制性的搜索就被引導(dǎo)到尋找的信息處。知識庫也可能相當(dāng)復(fù)雜,如材料檢測問題中所有主要缺陷的相關(guān)列表或者圖像數(shù)據(jù)庫(該庫包含變化檢測應(yīng)用相關(guān)區(qū)域的高分辨率衛(wèi)星圖像) 。除了引導(dǎo)每一個處理模塊的操作,知識庫還要控制模塊間的交互。這一特性上面圖 2 中的處理模塊和知識庫間用雙箭頭表示。相反單頭箭頭連接處理模塊。2.邊緣檢測邊緣檢測是圖像處理和計算機視覺中的術(shù)語,尤其在特征檢測和特征抽取領(lǐng)域,是一種用來識別數(shù)字圖像亮度驟變點即不連續(xù)點的算法。盡管在任何關(guān)于分割的討論中,點和線檢測都是很重要的,但是邊緣檢測對于灰度級間斷的檢測是最為普遍的檢測方法。雖然某些文獻提過理想的邊緣檢測步驟,但自然界圖像的邊緣并不總是理想的階梯邊緣。相反,它們通常受到一個或多個下面所列因素的影響:1.有限場景深度帶來的聚焦模糊;2.非零半徑光源產(chǎn)生的陰影帶來的半影模糊;3.光滑物體邊緣的陰影;4.物體邊緣附近的局部鏡面反射或者漫反射。一個典型的邊界可能是(例如)一塊紅色和一塊黃色之間的邊界;與之相反的是邊線,可能是在另外一種不變的背景上的少數(shù)不同顏色的點。在邊線的每一邊都有一個邊緣。在對數(shù)字圖像的處理中,邊緣檢測是一項非常重要的工作。如果將邊緣認為是一定數(shù)量點亮度發(fā)生變化的地方,那么邊緣檢測大體上就是計算這個亮度變化的導(dǎo)數(shù)。為簡化起見,我們可以先在一維空間分析邊緣檢測。在這個例子中,我們的數(shù)據(jù)是一行不同點亮度的數(shù)據(jù)。例如,在下面的 1 維數(shù)據(jù)中我們可以直觀地說在第 4 與第 5 個點之間有一個邊界:5 7 6 4 152 148 149如果光強度差別比第四個和第五個點之間小,或者說相鄰的像素點之間光強度差更高,就不能簡單地說相應(yīng)區(qū)域存在邊緣。而且,甚至可以認為這個例子中存在多個邊緣。除非場景中的物體非常簡單并且照明條件得到了很好的控制,否則確定一個用來判斷兩個相鄰點之間有多大的亮度變化才算是有邊界的閾值,并不是一件容易的事。實際上,這也是為什么邊緣檢測不是一個簡單問題的原因之一。有許多用于邊緣檢測的方法,它們大致可分為兩類:基于搜索和基于零交叉.基于搜索的邊緣檢測方法首先計算邊緣強度,通常用一階導(dǎo)數(shù)表示,例如梯度模;然后,用計算估計邊緣的局部方向,通常采用梯度的方向,并利用此方向找到局部梯度模的最大值?;诹憬徊娴姆椒ㄕ业接蓤D像得到的二階導(dǎo)數(shù)的零交叉點來定位邊緣。通常用拉普拉斯算子或非線性微分方程的零交叉點,我們將在后面的小節(jié)中描述.濾波做為邊緣檢測的預(yù)處理通常是必要的,通常采用高斯濾波。已發(fā)表的邊緣檢測方法應(yīng)用計算邊界強度的度量, 這與平滑濾波有本質(zhì)的不同. 正如許多邊緣檢測方法依賴于圖像梯度的計算, 他們用不同種類的濾波器來估計 x-方向和 y-方向的梯度.一旦我們計算出導(dǎo)數(shù)之后,下一步要做的就是給出一個閾值來確定哪里是邊緣位置。閾值越低,能夠檢測出的邊線越多,結(jié)果也就越容易受到圖片噪聲的影響,并且越容易從圖像中挑出不相關(guān)的特性。與此相反,一個高的閾值將會遺失細的或者短的線段。如果邊緣閾值應(yīng)用于正確的的梯度幅度圖像,生成的邊緣一般會較厚,某些形式的邊緣變薄處理是必要的。然而非最大抑制的邊緣檢測,邊緣曲線的定義十分模糊,邊緣像素可能成為邊緣多邊形通過一個邊緣連接(邊緣跟蹤)的過程。在一個離散矩陣中,非最大抑制階梯能夠通過一種方法來實現(xiàn),首先預(yù)測一階導(dǎo)數(shù)方向、然后把它近似到 45 度的倍數(shù)、最后在預(yù)測的梯度方向比較梯度幅度。一個常用的這種方法是帶有滯后作用的閾值選擇。這個方法使用不同的閾值去尋找邊緣。首先使用一個閾值上限去尋找邊線開始的地方。一旦找到了一個開始點,我們在圖像上逐點跟蹤邊緣路徑,當(dāng)大于門檻下限時一直紀錄邊緣位置,直到數(shù)值小于下限之后才停止紀錄。這種方法假設(shè)邊緣是連續(xù)的界線,并且我們能夠跟蹤前面所看到的邊緣的模糊部分,而不會將圖像中的噪聲點標(biāo)記為邊緣。但是,我們?nèi)匀淮嬖谶x擇適當(dāng)?shù)拈撝祬?shù)的問題,而且不同圖像的閾值差別也很大。其它一些邊緣檢測操作是基于亮度的二階導(dǎo)數(shù)。這實質(zhì)上是亮度梯度的變化率。在理想的連續(xù)變化情況下,在二階導(dǎo)數(shù)中檢測過零點將得到梯度中的局部最大值。另一方面,二階導(dǎo)數(shù)中的峰值檢測是邊線檢測,只要圖像操作使用一個合適的尺度表示。如上所述,邊線是雙重邊緣,這樣我們就可以在邊線的一邊看到一個亮度梯度,而在另一邊看到相反的梯度。這樣如果圖像中有邊線出現(xiàn)的話我們就能在亮度梯度上看到非常大的變化。為了找到這些邊線,我們可以在圖像亮度梯度的二階導(dǎo)數(shù)中尋找過零點??傊?,為了對有意義的邊緣點進行分類,與這個點相聯(lián)系的灰度級變換必須比在這一點的背景上變換更為有效。由于我們用局部計算進行處理,決定一個值是否有效的選擇方法就是使用門限。因此,如果一個點的二維一階導(dǎo)數(shù)比指定的門限大,我們就定義圖像中的此點是一個邊緣點。術(shù)語“邊緣線段”一般在邊緣與圖像的尺寸比起來很短時才使用。分割的關(guān)鍵問題是如何將邊緣線段組合成更長的邊緣。如果我們選擇使用二階導(dǎo)數(shù),則另一個可用的定義是將圖像中的邊緣點定義為它的二階導(dǎo)數(shù)的零交叉點。此時,邊緣的定義同上面講過的定義是一樣的。應(yīng)注意,這些定義并不能保證在一幅圖像中成功地找到邊緣,它們只是給了我們一個尋找邊緣的形式體系。圖像中的一階導(dǎo)數(shù)用梯度計算,二階導(dǎo)數(shù)使用拉普拉斯算子得到。- 1.請仔細閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認領(lǐng)!既往收益都歸您。
下載文檔到電腦,查找使用更方便
20 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該PPT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 數(shù)字圖像 處理 邊緣 檢測 中文翻譯
鏈接地址:http://m.kudomayuko.com/p-172571.html