數(shù)字圖像處理和邊緣檢測-中文翻譯
《數(shù)字圖像處理和邊緣檢測-中文翻譯》由會(huì)員分享,可在線閱讀,更多相關(guān)《數(shù)字圖像處理和邊緣檢測-中文翻譯(4頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
中文譯文數(shù)字圖像處理和邊緣檢測1.數(shù)字圖像處理數(shù)字圖像處理方法的研究源于兩個(gè)主要應(yīng)用領(lǐng)域:為便于人們分析而對(duì)圖像信息進(jìn)行改進(jìn);為使機(jī)器自動(dòng)理解而對(duì)圖像數(shù)據(jù)進(jìn)行存儲(chǔ)、傳輸及顯示。一幅圖像可定義為一個(gè)二維函數(shù) ,這里 x 和 y 是空間坐標(biāo),而在任何一對(duì)空間坐標(biāo)(,)fxy上的幅值 f 稱為該點(diǎn)圖像的強(qiáng)度或灰度。當(dāng) 和幅值 f 為有限的、離散的數(shù)值時(shí),則圖像為(,)xy ,數(shù)字圖像。數(shù)字圖像處理是指借用數(shù)字計(jì)算機(jī)處理數(shù)字圖像,值得提及的是數(shù)字圖像是由有限的元素組成的,每一個(gè)元素都有一個(gè)特定的位置和幅值,這些元素稱為圖像元素、畫面元素或像素。像素是廣泛用于表示數(shù)字圖像元素的詞匯。視覺是人類最高級(jí)的感知器官,所以,毫無疑問圖像在人類感知中扮演著最重要的角色。然而,人類感知只限于電磁波譜的視覺波段,成像機(jī)器則可覆蓋幾乎全部電磁波譜,從伽馬射線到無線電波。它們可以對(duì)非人類習(xí)慣的那些圖像源進(jìn)行加工,這些圖像源包括超聲波、電子顯微鏡及計(jì)算機(jī)產(chǎn)生的圖像。因此,數(shù)字圖像處理涉及各種各樣的應(yīng)用領(lǐng)域。圖像處理涉及的范疇或其他相關(guān)領(lǐng)域(例如,圖像分析和計(jì)算機(jī)視覺)的界定在初創(chuàng)人之間并沒有一致的看法。有時(shí)用處理的輸入和輸出內(nèi)容都是圖像這一特點(diǎn)來界定圖像處理的范圍。我們認(rèn)為這一定義僅是人為界定和限制。例如,在這個(gè)定義下,甚至最普通的計(jì)算一幅圖像灰度平均值的工作都不能算做是圖像處理。另一方面,有些領(lǐng)域(如計(jì)算機(jī)視覺)研究的最高目標(biāo)是用計(jì)算機(jī)去模擬人類視覺,包括理解和推理并根據(jù)視覺輸入采取行動(dòng)等。這一領(lǐng)域本身是人工智能的分支,其目的是模仿人類智能。人工智能領(lǐng)域處在其發(fā)展過程中的初期階段,它的發(fā)展比預(yù)期的要慢的多,圖像分析(也稱為圖像理解)領(lǐng)域則處在圖像處理和計(jì)算機(jī)視覺兩個(gè)學(xué)科之間。從圖像處理到計(jì)算機(jī)視覺這個(gè)連續(xù)的統(tǒng)一體內(nèi)并沒有明確的界線。然而,在這個(gè)連續(xù)的統(tǒng)一體中可以考慮三種典型的計(jì)算處理(即低級(jí)、中級(jí)和高級(jí)處理)來區(qū)分其中的各個(gè)學(xué)科。低級(jí)處理涉及初級(jí)操作,如降低噪聲的圖像預(yù)處理,對(duì)比度增強(qiáng)和圖像尖銳化。低級(jí)處理是以輸入、輸出都是圖像為特點(diǎn)的處理。中級(jí)處理涉及分割(把圖像分為不同區(qū)域或目標(biāo)物)以及縮減對(duì)目標(biāo)物的描述,以使其更適合計(jì)算機(jī)處理及對(duì)不同目標(biāo)的分類(識(shí)別) 。中級(jí)圖像處理是以輸入為圖像,但輸出是從這些圖像中提取的特征(如邊緣、輪廓及不同物體的標(biāo)識(shí)等)為特點(diǎn)的。最后,高級(jí)處理涉及在圖像分析中被識(shí)別物體的總體理解,以及執(zhí)行與視覺相關(guān)的識(shí)別函數(shù)(處在連續(xù)統(tǒng)一體邊緣)等。根據(jù)上述討論,我們看到,圖像處理和圖像分析兩個(gè)領(lǐng)域合乎邏輯的重疊區(qū)域是圖像中特定區(qū)域或物體的識(shí)別這一領(lǐng)域。這樣,在研究中,我們界定數(shù)字圖像處理包括輸入和輸出均是圖像的處理,同時(shí)也包括從圖像中提取特征及識(shí)別特定物體的處理。舉一個(gè)簡單的文本自動(dòng)分析方面的例子來具體說明這一概念。在自動(dòng)分析文本時(shí)首先獲取一幅包含文本的圖像,對(duì)該圖像進(jìn)行預(yù)處理,提取(分割)字符,然后以適合計(jì)算機(jī)處理的形式描述這些字符,最后識(shí)別這些字符,而所有這些操作都在本文界定的數(shù)字圖像處理的范圍內(nèi)。理解一頁的內(nèi)容可能要根據(jù)理解的復(fù)雜度從圖像分析或計(jì)算機(jī)視覺領(lǐng)域考慮問題。這樣,我們定義的數(shù)字圖像處理的概念將在有特殊社會(huì)和經(jīng)濟(jì)價(jià)值的領(lǐng)域內(nèi)通用。數(shù)字圖像處理的應(yīng)用領(lǐng)域多種多樣,所以文本在內(nèi)容組織上盡量達(dá)到該技術(shù)應(yīng)用領(lǐng)域的廣度。闡述數(shù)字圖像處理應(yīng)用范圍最簡單的一種方法是根據(jù)信息源來分類(如可見光、X 射線,等等) 。在今天的應(yīng)用中,最主要的圖像源是電磁能譜,其他主要的能源包括聲波、超聲波和電子(以用于電子顯微鏡方法的電子束形式) 。建模和可視化應(yīng)用中的合成圖像由計(jì)算機(jī)產(chǎn)生。建立在電磁波譜輻射基礎(chǔ)上的圖像是最熟悉的,特別是 X 射線和可見光譜圖像。電磁波可定義為以各種波長傳播的正弦波,或者認(rèn)為是一種粒子流,每個(gè)粒子包含一定(一束)能量,每束能量成為一個(gè)光子。如果光譜波段根據(jù)光譜能量進(jìn)行分組,我們會(huì)得到下圖 1 所示的伽馬射線(最高能量)到無線電波(最低能量)的光譜。如圖所示的加底紋的條帶表達(dá)了這樣一個(gè)事實(shí),即電磁波譜的各波段間并沒有明確的界線,而是由一個(gè)波段平滑地過渡到另一個(gè)波段。圖像獲取是第一步處理。注意到獲取與給出一幅數(shù)字形式的圖像一樣簡單。通常,圖像獲取包括如設(shè)置比例尺等預(yù)處理。圖像增強(qiáng)是數(shù)字圖像處理最簡單和最有吸引力的領(lǐng)域?;旧希鰪?qiáng)技術(shù)后面的思路是顯現(xiàn)那些被模糊了的細(xì)節(jié),或簡單地突出一幅圖像中感興趣的特征。一個(gè)圖像增強(qiáng)的例子是增強(qiáng)圖像的對(duì)比度,使其看起來好一些。應(yīng)記住,增強(qiáng)是圖像處理中非常主觀的領(lǐng)域,這一點(diǎn)很重要。圖像復(fù)原也是改進(jìn)圖像外貌的一個(gè)處理領(lǐng)域。然而,不像增強(qiáng),圖像增強(qiáng)是主觀的,而圖像復(fù)原是客觀的。在某種意義上說,復(fù)原技術(shù)傾向于以圖像退化的數(shù)學(xué)或概率模型為基礎(chǔ)。另一方面,增強(qiáng)以怎樣構(gòu)成好的增強(qiáng)效果這種人的主觀偏愛為基礎(chǔ)。彩色圖像處理已經(jīng)成為一個(gè)重要領(lǐng)域,因?yàn)榛诨ヂ?lián)網(wǎng)的圖像處理應(yīng)用在不斷增長。就使得在彩色模型、數(shù)字域的彩色處理方面涵蓋了大量基本概念。在后續(xù)發(fā)展,彩色還是圖像中感興趣特征被提取的基礎(chǔ)。小波是在各種分辨率下描述圖像的基礎(chǔ)。特別是在應(yīng)用中,這些理論被用于圖像數(shù)據(jù)壓縮及金字塔描述方法。在這里,圖像被成功地細(xì)分為較小的區(qū)域。壓縮,正如其名稱所指的意思,所涉及的技術(shù)是減少圖像的存儲(chǔ)量,或者在傳輸圖像時(shí)降低頻帶。雖然存儲(chǔ)技術(shù)在過去的十年內(nèi)有了很大改進(jìn),但對(duì)傳輸能力我們還不能這樣說,尤其在互聯(lián)網(wǎng)上更是如此,互聯(lián)網(wǎng)是以大量的圖片內(nèi)容為特征的。圖像壓縮技術(shù)對(duì)應(yīng)的圖像文件擴(kuò)展名對(duì)大多數(shù)計(jì)算機(jī)用戶是很熟悉的(也許沒注意) ,如 JPG 文件擴(kuò)展名用于 JPEG(聯(lián)合圖片專家組)圖像壓縮標(biāo)準(zhǔn)。形態(tài)學(xué)處理設(shè)計(jì)提取圖像元素的工具,它在表現(xiàn)和描述形狀方面非常有用。這一章的材料將從輸出圖像處理到輸出圖像特征處理的轉(zhuǎn)換開始。分割過程將一幅圖像劃分為組成部分或目標(biāo)物。通常,自主分割是數(shù)字圖像處理中最為困難的任務(wù)之一。復(fù)雜的分割過程導(dǎo)致成功解決要求物體被分別識(shí)別出來的成像問題需要大量處理工作。另一方面,不健壯且不穩(wěn)定的分割算法幾乎總是會(huì)導(dǎo)致最終失敗。通常,分割越準(zhǔn)確,識(shí)別越成功。表示和描述幾乎總是跟隨在分割步驟的輸后邊,通常這一輸出是未加工的數(shù)據(jù),其構(gòu)成不是區(qū)域的邊緣(區(qū)分一個(gè)圖像區(qū)域和另一個(gè)區(qū)域的像素集)就是其區(qū)域本身的所有點(diǎn)。無論哪種情況,把數(shù)據(jù)轉(zhuǎn)換成適合計(jì)算機(jī)處理的形式都是必要的。首先,必須確定數(shù)據(jù)是應(yīng)該被表現(xiàn)為邊界還是整個(gè)區(qū)域。當(dāng)注意的焦點(diǎn)是外部形狀特性(如拐角和曲線)時(shí),則邊界表示是合適的。當(dāng)注意的焦點(diǎn)是內(nèi)部特性(如紋理或骨骼形狀)時(shí),則區(qū)域表示是合適的。則某些應(yīng)用中,這些表示方法是互補(bǔ)的。選擇一種表現(xiàn)方式僅是解決把原始數(shù)據(jù)轉(zhuǎn)換為適合計(jì)算機(jī)后續(xù)處理的形式的一部分。為了描述數(shù)據(jù)以使感興趣的特征更明顯,還必須確定一種方法。描述也叫特征選擇,涉及提取特征,該特征是某些感興趣的定量信息或是區(qū)分一組目標(biāo)與其他目標(biāo)的基礎(chǔ)。識(shí)別是基于目標(biāo)的描述給目標(biāo)賦以符號(hào)的過程。如上文詳細(xì)討論的那樣,我們用識(shí)別個(gè)別目標(biāo)方法的開發(fā)推出數(shù)字圖像處理的覆蓋范圍。到目前為止,還沒有談到上面圖 2 中關(guān)于先驗(yàn)知識(shí)及知識(shí)庫與處理模塊之間的交互這部分內(nèi)容。關(guān)于問題域的知識(shí)以知識(shí)庫的形式被編碼裝入一個(gè)圖像處理系統(tǒng)。這一知識(shí)可能如圖像細(xì)節(jié)區(qū)域那樣簡單,在這里,感興趣的信息被定位,這樣,限制性的搜索就被引導(dǎo)到尋找的信息處。知識(shí)庫也可能相當(dāng)復(fù)雜,如材料檢測問題中所有主要缺陷的相關(guān)列表或者圖像數(shù)據(jù)庫(該庫包含變化檢測應(yīng)用相關(guān)區(qū)域的高分辨率衛(wèi)星圖像) 。除了引導(dǎo)每一個(gè)處理模塊的操作,知識(shí)庫還要控制模塊間的交互。這一特性上面圖 2 中的處理模塊和知識(shí)庫間用雙箭頭表示。相反單頭箭頭連接處理模塊。2.邊緣檢測邊緣檢測是圖像處理和計(jì)算機(jī)視覺中的術(shù)語,尤其在特征檢測和特征抽取領(lǐng)域,是一種用來識(shí)別數(shù)字圖像亮度驟變點(diǎn)即不連續(xù)點(diǎn)的算法。盡管在任何關(guān)于分割的討論中,點(diǎn)和線檢測都是很重要的,但是邊緣檢測對(duì)于灰度級(jí)間斷的檢測是最為普遍的檢測方法。雖然某些文獻(xiàn)提過理想的邊緣檢測步驟,但自然界圖像的邊緣并不總是理想的階梯邊緣。相反,它們通常受到一個(gè)或多個(gè)下面所列因素的影響:1.有限場景深度帶來的聚焦模糊;2.非零半徑光源產(chǎn)生的陰影帶來的半影模糊;3.光滑物體邊緣的陰影;4.物體邊緣附近的局部鏡面反射或者漫反射。一個(gè)典型的邊界可能是(例如)一塊紅色和一塊黃色之間的邊界;與之相反的是邊線,可能是在另外一種不變的背景上的少數(shù)不同顏色的點(diǎn)。在邊線的每一邊都有一個(gè)邊緣。在對(duì)數(shù)字圖像的處理中,邊緣檢測是一項(xiàng)非常重要的工作。如果將邊緣認(rèn)為是一定數(shù)量點(diǎn)亮度發(fā)生變化的地方,那么邊緣檢測大體上就是計(jì)算這個(gè)亮度變化的導(dǎo)數(shù)。為簡化起見,我們可以先在一維空間分析邊緣檢測。在這個(gè)例子中,我們的數(shù)據(jù)是一行不同點(diǎn)亮度的數(shù)據(jù)。例如,在下面的 1 維數(shù)據(jù)中我們可以直觀地說在第 4 與第 5 個(gè)點(diǎn)之間有一個(gè)邊界:5 7 6 4 152 148 149如果光強(qiáng)度差別比第四個(gè)和第五個(gè)點(diǎn)之間小,或者說相鄰的像素點(diǎn)之間光強(qiáng)度差更高,就不能簡單地說相應(yīng)區(qū)域存在邊緣。而且,甚至可以認(rèn)為這個(gè)例子中存在多個(gè)邊緣。除非場景中的物體非常簡單并且照明條件得到了很好的控制,否則確定一個(gè)用來判斷兩個(gè)相鄰點(diǎn)之間有多大的亮度變化才算是有邊界的閾值,并不是一件容易的事。實(shí)際上,這也是為什么邊緣檢測不是一個(gè)簡單問題的原因之一。有許多用于邊緣檢測的方法,它們大致可分為兩類:基于搜索和基于零交叉.基于搜索的邊緣檢測方法首先計(jì)算邊緣強(qiáng)度,通常用一階導(dǎo)數(shù)表示,例如梯度模;然后,用計(jì)算估計(jì)邊緣的局部方向,通常采用梯度的方向,并利用此方向找到局部梯度模的最大值?;诹憬徊娴姆椒ㄕ业接蓤D像得到的二階導(dǎo)數(shù)的零交叉點(diǎn)來定位邊緣。通常用拉普拉斯算子或非線性微分方程的零交叉點(diǎn),我們將在后面的小節(jié)中描述.濾波做為邊緣檢測的預(yù)處理通常是必要的,通常采用高斯濾波。已發(fā)表的邊緣檢測方法應(yīng)用計(jì)算邊界強(qiáng)度的度量, 這與平滑濾波有本質(zhì)的不同. 正如許多邊緣檢測方法依賴于圖像梯度的計(jì)算, 他們用不同種類的濾波器來估計(jì) x-方向和 y-方向的梯度.一旦我們計(jì)算出導(dǎo)數(shù)之后,下一步要做的就是給出一個(gè)閾值來確定哪里是邊緣位置。閾值越低,能夠檢測出的邊線越多,結(jié)果也就越容易受到圖片噪聲的影響,并且越容易從圖像中挑出不相關(guān)的特性。與此相反,一個(gè)高的閾值將會(huì)遺失細(xì)的或者短的線段。如果邊緣閾值應(yīng)用于正確的的梯度幅度圖像,生成的邊緣一般會(huì)較厚,某些形式的邊緣變薄處理是必要的。然而非最大抑制的邊緣檢測,邊緣曲線的定義十分模糊,邊緣像素可能成為邊緣多邊形通過一個(gè)邊緣連接(邊緣跟蹤)的過程。在一個(gè)離散矩陣中,非最大抑制階梯能夠通過一種方法來實(shí)現(xiàn),首先預(yù)測一階導(dǎo)數(shù)方向、然后把它近似到 45 度的倍數(shù)、最后在預(yù)測的梯度方向比較梯度幅度。一個(gè)常用的這種方法是帶有滯后作用的閾值選擇。這個(gè)方法使用不同的閾值去尋找邊緣。首先使用一個(gè)閾值上限去尋找邊線開始的地方。一旦找到了一個(gè)開始點(diǎn),我們在圖像上逐點(diǎn)跟蹤邊緣路徑,當(dāng)大于門檻下限時(shí)一直紀(jì)錄邊緣位置,直到數(shù)值小于下限之后才停止紀(jì)錄。這種方法假設(shè)邊緣是連續(xù)的界線,并且我們能夠跟蹤前面所看到的邊緣的模糊部分,而不會(huì)將圖像中的噪聲點(diǎn)標(biāo)記為邊緣。但是,我們?nèi)匀淮嬖谶x擇適當(dāng)?shù)拈撝祬?shù)的問題,而且不同圖像的閾值差別也很大。其它一些邊緣檢測操作是基于亮度的二階導(dǎo)數(shù)。這實(shí)質(zhì)上是亮度梯度的變化率。在理想的連續(xù)變化情況下,在二階導(dǎo)數(shù)中檢測過零點(diǎn)將得到梯度中的局部最大值。另一方面,二階導(dǎo)數(shù)中的峰值檢測是邊線檢測,只要圖像操作使用一個(gè)合適的尺度表示。如上所述,邊線是雙重邊緣,這樣我們就可以在邊線的一邊看到一個(gè)亮度梯度,而在另一邊看到相反的梯度。這樣如果圖像中有邊線出現(xiàn)的話我們就能在亮度梯度上看到非常大的變化。為了找到這些邊線,我們可以在圖像亮度梯度的二階導(dǎo)數(shù)中尋找過零點(diǎn)??傊?,為了對(duì)有意義的邊緣點(diǎn)進(jìn)行分類,與這個(gè)點(diǎn)相聯(lián)系的灰度級(jí)變換必須比在這一點(diǎn)的背景上變換更為有效。由于我們用局部計(jì)算進(jìn)行處理,決定一個(gè)值是否有效的選擇方法就是使用門限。因此,如果一個(gè)點(diǎn)的二維一階導(dǎo)數(shù)比指定的門限大,我們就定義圖像中的此點(diǎn)是一個(gè)邊緣點(diǎn)。術(shù)語“邊緣線段”一般在邊緣與圖像的尺寸比起來很短時(shí)才使用。分割的關(guān)鍵問題是如何將邊緣線段組合成更長的邊緣。如果我們選擇使用二階導(dǎo)數(shù),則另一個(gè)可用的定義是將圖像中的邊緣點(diǎn)定義為它的二階導(dǎo)數(shù)的零交叉點(diǎn)。此時(shí),邊緣的定義同上面講過的定義是一樣的。應(yīng)注意,這些定義并不能保證在一幅圖像中成功地找到邊緣,它們只是給了我們一個(gè)尋找邊緣的形式體系。圖像中的一階導(dǎo)數(shù)用梯度計(jì)算,二階導(dǎo)數(shù)使用拉普拉斯算子得到。- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
20 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 數(shù)字圖像 處理 邊緣 檢測 中文翻譯
鏈接地址:http://m.kudomayuko.com/p-172571.html