現(xiàn)代數(shù)字圖像處理技術(shù) 版權(quán)信息
- ISBN:9787030701176
- 條形碼:9787030701176 ; 978-7-03-070117-6
- 裝幀:一般膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>
現(xiàn)代數(shù)字圖像處理技術(shù) 本書特色
適讀人群 :圖像處理、計(jì)算機(jī)視覺、人工智能等專業(yè)高年級(jí)本科生和 研究生,從事相關(guān)領(lǐng)域研究的技術(shù)人員計(jì)算機(jī)視覺、人工智能、圖像處理
現(xiàn)代數(shù)字圖像處理技術(shù) 內(nèi)容簡介
本書主要對(duì)現(xiàn)代數(shù)字圖像處理技術(shù)的研究方法、傳統(tǒng)算法以及基于深度學(xué)習(xí)的方法進(jìn)行了介紹。全書共七章。章介紹數(shù)字圖像處理相關(guān)基礎(chǔ)知識(shí),包括概要,基本運(yùn)算和一些基礎(chǔ)操作。第二章主要介紹人工神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò),包括神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)知識(shí),卷積神經(jīng)網(wǎng)絡(luò)的相關(guān)概念以及常用的卷積神經(jīng)網(wǎng)絡(luò)。第三章到第七章按照從低語義到高語義的順序,分別具體介紹計(jì)算機(jī)視覺中的具體任務(wù),包括基礎(chǔ)知識(shí),傳統(tǒng)方法和結(jié)合深度學(xué)習(xí)的方法。其中,第三章主要介紹圖像復(fù)原任務(wù),包括圖像去噪、圖像去模糊以及圖像去霧三個(gè)任務(wù)。第四章主要介紹圖像增強(qiáng)任務(wù),包括圖像平滑、圖像融合以及低光照?qǐng)D像增強(qiáng)。第五章主要介紹目標(biāo)檢測任務(wù),從傳統(tǒng)方法到深度學(xué)習(xí)的方法。第六章主要介紹圖像分割任務(wù),包括傳統(tǒng)的分割方法和基于深度學(xué)習(xí)的方法。很后第七章主要介紹多任務(wù)學(xué)習(xí),包括圖像與圖像邊緣,圖像與圖像結(jié)構(gòu),圖像與語義分割,圖像理解與圖像增強(qiáng)等四個(gè)部分。
現(xiàn)代數(shù)字圖像處理技術(shù) 目錄
目錄
前言
第1章 數(shù)字圖像處理基礎(chǔ) 1
1.1 數(shù)字圖像處理概述 1
1.1.1 圖像的概念 2
1.1.2 圖像的分類 3
1.1.3 圖像的語義 3
1.2 數(shù)字圖像處理基本運(yùn)算 5
1.2.1 基本運(yùn)算類型 5
1.2.2 點(diǎn)運(yùn)算 5
1.2.3 代數(shù)運(yùn)算 7
1.2.4 幾何運(yùn)算 8
1.3 數(shù)字圖像處理基礎(chǔ)知識(shí) 12
1.3.1 圖像的色彩空間 12
1.3.2 圖像的二值形態(tài)學(xué) 14
1.3.3 圖像的直方圖 14
1.3.4 圖像金字塔 17
1.3.5 邊緣特征提取 20
1.3.6 其他特征提取 26
參考文獻(xiàn) 28
第2章 神經(jīng)網(wǎng)絡(luò) 30
2.1 神經(jīng)網(wǎng)絡(luò)基礎(chǔ)知識(shí) 30
2.1.1 神經(jīng)元與感知機(jī) 30
2.1.2 反向傳播算法 33
2.1.3 輸入與輸出 35
2.1.4 激活函數(shù) 35
2.1.5 損失函數(shù) 37
2.2 神經(jīng)網(wǎng)絡(luò)的優(yōu)化及面臨的問題 38
2.2.1 參數(shù)初始化 38
2.2.2 正則化 41
2.2.3 常用優(yōu)化算法 41
2.2.4 神經(jīng)網(wǎng)絡(luò)面臨的問題 44
2.3 卷積神經(jīng)網(wǎng)絡(luò) 46
2.3.1 基礎(chǔ)知識(shí) 46
2.3.2 卷積神經(jīng)網(wǎng)絡(luò)組成 48
2.3.3 其他卷積方式 51
2.3.4 常用卷積神經(jīng)網(wǎng)絡(luò) 53
參考文獻(xiàn) 56
第3章 圖像復(fù)原 57
3.1 圖像去噪 57
3.1.1 簡介 57
3.1.2 常見噪聲模型 57
3.1.3 經(jīng)典傳統(tǒng)去噪方法 60
3.1.4 基于深度學(xué)習(xí)的去噪方法 64
3.1.5 真實(shí)圖像噪聲的去噪方法 71
3.1.6 小結(jié) 74
3.2 圖像去模糊 74
3.2.1 圖像去模糊理論基礎(chǔ) 74
3.2.2 基于優(yōu)化的傳統(tǒng)去模糊方法 78
3.2.3 基于深度學(xué)習(xí)的去模糊方法 87
3.2.4 小結(jié) 91
3.3 圖像去霧 91
3.3.1 圖像去霧的意義 91
3.3.2 傳統(tǒng)去霧方法 91
3.3.3 基于深度學(xué)習(xí)的方法 95
3.3.4 小結(jié) 97
參考文獻(xiàn) 97
第4章 圖像增強(qiáng) 100
4.1 圖像平滑 100
4.1.1 平滑的意義 100
4.1.2 傳統(tǒng)平滑方法 100
4.1.3 基于深度學(xué)習(xí)的方法 106
4.1.4 小結(jié) 110
4.2 圖像融合 110
4.2.1 圖像融合概述 110
4.2.2 基于變換域的圖像融合方法 113
4.2.3 基于空間域的圖像融合方法 114
4.2.4 基于深度學(xué)習(xí)的圖像融合方法 116
4.2.5 融合評(píng)價(jià)指標(biāo) 119
4.2.6 圖像融合的主要應(yīng)用 120
4.2.7 小結(jié) 122
4.3 低光照?qǐng)D像增強(qiáng) 123
4.3.1 低光照?qǐng)D像增強(qiáng)概述 123
4.3.2 基于Retinex理論的低光照?qǐng)D像增強(qiáng)算法 124
4.3.3 基于深度學(xué)習(xí)的低光照?qǐng)D像增強(qiáng)算法 127
4.3.4 小結(jié) 134
參考文獻(xiàn) 134
第5章 目標(biāo)檢測 136
5.1 基礎(chǔ)概念 136
5.1.1 背景知識(shí) 136
5.1.2 目標(biāo)檢測相關(guān)概念 136
5.2 傳統(tǒng)目標(biāo)檢測算法 137
5.2.1 傳統(tǒng)算法流程 137
5.2.2 傳統(tǒng)算法框架 138
5.3 基于深度學(xué)習(xí)的目標(biāo)檢測算法 149
5.3.1 雙階段目標(biāo)檢測算法 149
5.3.2 單階段目標(biāo)檢測算法 159
5.4 本章小結(jié) 173
參考文獻(xiàn) 173
第6章 圖像分割 176
6.1 概述 176
6.1.1 圖像分割概述 176
6.1.2 圖像分割發(fā)展背景 176
6.2 圖像分割傳統(tǒng)算法 177
6.2.1 基于閾值分割的算法 177
6.2.2 基于區(qū)域提取的算法 180
6.2.3 基于邊緣檢測的算法 182
6.2.4 結(jié)合特定理論工具的算法 183
6.3 基于深度學(xué)習(xí)的圖像分割算法 185
6.3.1 全卷積網(wǎng)絡(luò) 185
6.3.2 帶圖模型的卷積模型 188
6.3.3 基于編碼器-解碼器的結(jié)構(gòu) 190
6.3.4 基于多尺度和金字塔網(wǎng)絡(luò)的模型 193
6.3.5 膨脹卷積模型與DeepLab系列 197
6.3.6 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的模型 202
6.3.7 基于注意力機(jī)制的方法 205
6.3.8 生成模型和對(duì)抗訓(xùn)練 208
6.4 本章小結(jié) 211
參考文獻(xiàn) 211
第7章 多任務(wù)學(xué)習(xí) 213
7.1 圖像與圖像邊緣 213
7.1.1 邊緣引導(dǎo)的圖像補(bǔ)全 214
7.1.2 邊緣引導(dǎo)的圖像超分辨率 215
7.1.3 邊緣引導(dǎo)的語義分割 217
7.1.4 邊緣引導(dǎo)的圖像平滑 225
7.1.5 小結(jié) 227
7.2 圖像與圖像平滑 227
7.2.1 圖像平滑引導(dǎo)的圖像補(bǔ)全 227
7.2.2 小結(jié) 230
7.3 圖像與語義分割 230
7.3.1 語義分割引導(dǎo)的圖像補(bǔ)全 230
7.3.2 語義分割結(jié)合圖像超分辨率 231
7.3.3 語義分割引導(dǎo)的圖像重定向 234
7.3.4 場景分割引導(dǎo)的圖像融合 236
7.3.5 小結(jié) 239
7.4 圖像理解與圖像增強(qiáng)和復(fù)原 239
7.4.1 圖像增強(qiáng)結(jié)合目標(biāo)檢測 240
7.4.2 圖像增強(qiáng)結(jié)合語義分割 242
7.4.3 圖像去噪與圖像理解 244
7.4.4 圖像分類驅(qū)動(dòng)的圖像增強(qiáng) 245
7.4.5 小結(jié) 247
參考文獻(xiàn) 247
彩圖
現(xiàn)代數(shù)字圖像處理技術(shù) 節(jié)選
第1章 數(shù)字圖像處理基礎(chǔ) 1.1 數(shù)字圖像處理概述 數(shù)字圖像處理(Digital Image Processing)是指通過計(jì)算機(jī)對(duì)圖像進(jìn)行分析、加工和處理,使之滿足視覺、心理、工業(yè)生產(chǎn)等要求的技術(shù)。作為信號(hào)處理(Signal Processing)的一個(gè)子領(lǐng)域,相較于模擬圖像處理(Analog Image Processing)技術(shù),數(shù)字圖像處理技術(shù)有很多優(yōu)勢。首先,數(shù)字圖像處理的過程中不會(huì)引入新的噪聲和失真,可以更好地保持圖像原有的信息;其次,數(shù)字圖像處理技術(shù)比模擬圖像處理技術(shù)更加靈活,可以方便地引入多種多樣的計(jì)算機(jī)算法。因此,數(shù)字圖像處理逐漸取代了模擬圖像處理技術(shù),被廣泛地應(yīng)用于生活和生產(chǎn)中。 巴特蘭有線圖像傳輸系統(tǒng)(簡稱巴特蘭系統(tǒng))是數(shù)字圖像處理技術(shù)的早期應(yīng)用之一。該系統(tǒng)由哈里 巴塞洛繆和梅納德 麥克法蘭發(fā)明,利用電纜傳輸數(shù)字圖像。在1921年,他們首次應(yīng)用這一系統(tǒng),通過大西洋的海底電纜將數(shù)字圖像從倫敦傳遞到紐約。在該系統(tǒng)發(fā)明前,跨大西洋傳輸一幅圖像需要數(shù)天,而巴特蘭系統(tǒng)一次傳輸只需要花費(fèi)幾個(gè)小時(shí),因而該系統(tǒng)的發(fā)明對(duì)新聞業(yè)產(chǎn)生了巨大的影響。 1957年,羅素 基爾希和他的團(tuán)隊(duì)發(fā)明了世界上**臺(tái)數(shù)字圖像掃描儀;鶢栂Tx擇自己剛剛出生不久的兒子的照片來測試掃描儀,這使得這張照片成為世界上*早通過掃描儀掃描并存儲(chǔ)在計(jì)算機(jī)的圖片之一。在將圖片掃描后,他們還利用這些數(shù)字圖像測試了邊緣增強(qiáng)濾波器(Filter)等一系列圖像處理算法。可以說,他們的發(fā)明顯著地促進(jìn)了數(shù)字圖像處理技術(shù)和計(jì)算機(jī)視覺技術(shù)的進(jìn)步。2003年,這張照片入選了時(shí)代雜志評(píng)選的“改變世界的100張圖片”。 數(shù)字圖像處理作為一門學(xué)科形成于20世紀(jì)60年代初期。在1964年,徘徊者7號(hào)探測器成功地將上千張?jiān)虑虻膱D像傳輸回地球。受到電磁輻射等因素的干擾,這些圖像的質(zhì)量很差。為了改善圖像的質(zhì)量,加州理工學(xué)院的噴氣推進(jìn)實(shí)驗(yàn)室(Jet Propulsion Laboratory)率先將去噪、幾何修正、灰度變換等數(shù)字圖像處理技術(shù)應(yīng)用于這些圖像,并取得了巨大的成功?梢哉f,這是數(shù)字圖像處理技術(shù)首次真正意義上的應(yīng)用。圖1.1是經(jīng)過處理后徘徊者7號(hào)探測器從月球發(fā)回的照片。 1989年,法國計(jì)算機(jī)科學(xué)家 LeCun 等率先將卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)應(yīng)用于手寫數(shù)字識(shí)別[1]。隨后在1998年,他們提出了 LeNet[2]模型,這是人類首次使用卷積–池化(Pooling)–全連接(Fully Connected,F(xiàn)C)層結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)?梢哉f,他們的一系列工作開啟了在數(shù)字圖像處理領(lǐng)域應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)的先河。然而由于計(jì)算能力的瓶頸以及神經(jīng)網(wǎng)絡(luò)本身的可解釋性問題,在隨后的幾十年里,卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展走向了暫時(shí)的低谷。 圖1.1 徘徊者7號(hào)探測器發(fā)回的照片之一 圖形處理單元(Graphics Processing Unit,GPU)是用于在計(jì)算機(jī)上運(yùn)行繪圖運(yùn)算工作的微處理器,它擁有數(shù)百甚至數(shù)千個(gè)核心,具有進(jìn)行并行計(jì)算的潛力。2011年,Ciresan 等在 NVIDIA 公司推出的圖形處理器上訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),其訓(xùn)練速度是使用同時(shí)代中央處理器(Central Processing Unit,CPU)訓(xùn)練速度的10~60倍[3]。隨著計(jì)算能力的提升,基于卷積神經(jīng)網(wǎng)絡(luò)的一系列數(shù)字圖像處理方法重新引起人們的關(guān)注。2012年,由 Krizhevsky 等設(shè)計(jì)的 AlexNet[4]在同年的 ImageNet 大規(guī)模視覺識(shí)別挑戰(zhàn)賽上取得了15.3%的錯(cuò)誤率,比第二名低10.8%,掀起了卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于數(shù)字圖像處理領(lǐng)域的熱潮。此后,在圖像復(fù)原、圖像增強(qiáng)、目標(biāo)檢測、圖像分割等領(lǐng)域,基于卷積神經(jīng)網(wǎng)絡(luò)的一系列方法取得了出色的效果。目前,卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)成為數(shù)字圖像處理領(lǐng)域的研究重點(diǎn)。 1.1.1 圖像的概念 圖像(Image)是人類對(duì)視覺感知的物質(zhì)再現(xiàn)。圖像可以通過光學(xué)設(shè)備獲取,如顯微鏡成像;也可以通過自然事物人為地創(chuàng)作得到,如繪畫、雕塑;也可以通過電子元件捕獲,如數(shù)碼相機(jī)通過其感光元件將圖像轉(zhuǎn)化為電信號(hào),并存儲(chǔ)在存儲(chǔ)器中。 圖像可以被定義為一個(gè)二維函數(shù) f(x, y)∈ Rn,其中 x 和 y 都是空間坐標(biāo)(這里我們不考慮動(dòng)態(tài)圖像,如視頻,也不考慮三維圖像,如全息圖),而 f 在任意坐標(biāo)(x, y)處的取值代表該點(diǎn)處圖像的亮度情況。當(dāng) x、y、f(x, y)的取值都是有限的離散值時(shí),這個(gè)圖像就是數(shù)字圖像,反之則為模擬圖像?梢哉f,數(shù)字圖像是由有限個(gè)位置上的亮度信息組成的,這些位置上的亮度信息是數(shù)字圖像不可再分的基本元素,稱為像素(Pixel)。 在實(shí)踐中,人們往往需要將模擬圖像轉(zhuǎn)換成數(shù)字圖像。為此,首先需要取一些點(diǎn)(x, y)處的亮度值,稱為取樣(Sampling),保證了 x、y 都是有限的離散值。為了使 f(x, y)的取值也是有限的離散值,還需要將源圖像(Source Image)中 f(x, y)的取值按一定規(guī)則近似成某一范圍的整數(shù),這個(gè)過程稱為量化(Quantization)。對(duì)模擬圖像進(jìn)行取樣與量化并使其*終轉(zhuǎn)化為數(shù)字圖像的過程就稱為數(shù)字化(Digitize)。 用來表示圖像顏色的方法稱為色彩模式。常見的色彩模式有很多:RGB 色彩模式通過紅(Red)、綠(Green)、藍(lán)(Blue)三原色光的強(qiáng)度來表示色彩;HSV 色彩模式通過色相(Hue)、飽和度(Saturation)、明度(Value)來表示色彩;而廣泛應(yīng)用于印刷領(lǐng)域的 CMYK 色彩模式則是利用青色、洋紅色、黃色和黑色四種顏色的強(qiáng)度來表示圖像。這些色彩模式都需要多個(gè)分量來表示顏色,每一個(gè)分量對(duì)應(yīng)的灰度圖像就稱為通道(Channel)。 1.1.2圖像的分類 按照在計(jì)算機(jī)中存儲(chǔ)的方式,數(shù)字圖像可以分為二值圖像(Binary Image)、灰度圖像(Grayscale Image)、彩色圖像、索引圖像(Indexed Images)。 (1)二值圖像:二值圖像就是每個(gè)像素只有0,1兩種取值的數(shù)字圖像。由于每個(gè)像素只有0和1兩種取值,二值圖像經(jīng)常作為圖像分割、圖像二值化的處理結(jié)果。 (2)灰度圖像:灰度圖像是每個(gè)像素只有一個(gè)采樣值的數(shù)字圖像。如果采樣值只有0,1兩種取值,灰度圖像就退化為二值圖像了。 (3)彩色圖像:彩色圖像的每個(gè)像素都需要用多個(gè)分量的強(qiáng)度值來表示。表示彩色圖像的這些方式也就是色彩模式。 (4)索引圖像:索引圖像用顏色索引表存儲(chǔ)圖片中出現(xiàn)的所有顏色在色彩空間中的取值。而在圖片矩陣中存儲(chǔ)對(duì)應(yīng)顏色在索引表中的索引值。在讀取索引圖像時(shí),對(duì)每個(gè)像素,都要先查找顏色索引表,然后讀取對(duì)應(yīng)的色彩值。 從圖像是否隨時(shí)間變化,我們可以把數(shù)字圖像分為靜止圖像和動(dòng)態(tài)圖像。如果一幅圖像各像素的亮度值不隨時(shí)間變化而變化,就稱其為靜止圖像。在動(dòng)態(tài)圖像中,像素的位置不能用二維的(x, y)表示,而是變成了三維的(x, y, t),其中 t 是時(shí)間變量。動(dòng)態(tài)圖像*常見的一個(gè)例子就是視頻。利用人眼成像的視覺暫留(Persistence of Vision)效應(yīng),動(dòng)態(tài)圖像通過把多張靜態(tài)圖像以較快的速度進(jìn)行切換,使得人能夠看到不斷變化的圖像。 1.1.3 圖像的語義 語義,即語言所蘊(yùn)含的意義。語言由符號(hào)組成,符號(hào)本身并沒有含義,而由符號(hào)組成的語言卻蘊(yùn)含著豐富的信息,這些信息就是語義。同樣地,圖像是由一系列亮度值組成的,一個(gè)像素處的亮度值本身并不蘊(yùn)含信息,而圖像中卻蘊(yùn)含有豐富的信息。通過類比,我們可以定義圖像的語義:圖像的語義就是圖像中蘊(yùn)含的意義。 按照抽象程度的高低,圖像語義可以分成低層語義(Low-level Semantics)與高層語義(High-level Semantics)兩類。低層語義主要是圖像的特征,如圖像中的色彩、形狀、紋理等。與低層語義相關(guān)的數(shù)字圖像處理技術(shù)主要包括如下內(nèi)容。 (1)圖像邊緣檢測(Edge Detection):圖像邊緣檢測的目標(biāo)是檢測和標(biāo)識(shí)數(shù)字圖像中亮度或色彩變化明顯的點(diǎn)。圖像的邊緣蘊(yùn)含著豐富的圖像結(jié)構(gòu)信息,可以進(jìn)一步用于改善圖像增強(qiáng)、目標(biāo)檢測、圖像分割等的效果。 (2)圖像增強(qiáng)(Image Enhancement):在圖片增強(qiáng)問題中,人們希望能有選擇地突出圖像中一些感興趣的區(qū)域,或者抑制一些不重要的特征,來改善圖像的質(zhì)量。例如,在較差的光照條件下拍攝的圖像往往存在亮度低、對(duì)比度差等問題。這不僅影響觀感,也影響目標(biāo)檢測、圖像分割等下游任務(wù)的效果。低光照?qǐng)D像增強(qiáng)方法就可以用來改善這些圖像的質(zhì)量。 (3)圖像融合(Image Fusion):圖像融合是通過兩幅或多幅圖像的信息綜合生成一幅圖像的技術(shù)。通過綜合利用這些圖像在時(shí)空上的相關(guān)性、信息上的互補(bǔ)性,圖像融合技術(shù)可以生成高質(zhì)量的圖像,從而方便人或計(jì)算機(jī)的進(jìn)一步使用。 (4)圖像復(fù)原(Image Restoration):數(shù)字圖像在成像、數(shù)字化和傳輸過程中常受到成像設(shè)備與外部環(huán)境噪聲干擾,這一過程就是圖像的退化(Degenerate)。圖像復(fù)原的目標(biāo)是通過先驗(yàn)知識(shí)去恢復(fù)被退化的圖像。由于退化的原因是多種多樣的,圖像復(fù)原有很多分支,如圖像去噪(Image Denoising)、圖像去雨、圖像去霧、圖像去模糊等。 高層語義側(cè)重于圖像中蘊(yùn)含的物體與概念,如圖像中物體的相對(duì)位置,圖像通過場景、行為、情感表達(dá)的意義等。高層語義更接近于人類對(duì)圖像的理解,抽象程度更高。與高層語義相關(guān)的數(shù)字圖像處理技術(shù)主要包括如下內(nèi)容。 (1)圖像分類(Image Classification):圖像分類任務(wù)的目標(biāo)是給圖像一個(gè)或者多個(gè)標(biāo)簽,以指示圖像中的主要內(nèi)容或所屬類別。常見的圖像分類的應(yīng)用有相冊圖片歸類、以圖搜圖、場景識(shí)別、醫(yī)療病理圖像分類等。 (2)目標(biāo)檢測(Object Detection):目標(biāo)檢測技術(shù)是用于從圖像中識(shí)別和定位預(yù)定義類別的物體實(shí)例的技術(shù),一般包含目標(biāo)定位和目標(biāo)分類兩個(gè)子任務(wù),涉及了回歸和分類兩個(gè)課題。目標(biāo)檢測的應(yīng)用方向包括:人臉識(shí)別、車輛檢測、安保系統(tǒng)、醫(yī)療領(lǐng)域等。 (3)圖像分割(Image Segmentation):圖像分割指的是根據(jù)圖像的灰度、色彩、紋理、幾何形狀等特征,將圖像劃分成若干個(gè)互不相交的區(qū)域,使得同一區(qū)域內(nèi)的像素有某種共同的視覺特性。圖像分割算法在醫(yī)學(xué)圖像處理、無人駕駛、安防監(jiān)控等領(lǐng)域都得到了廣泛的應(yīng)用。 1.2 數(shù)字圖像處理基本運(yùn)算 1.2.1 基本運(yùn)算類型 在圖像處理中,我們經(jīng)常要采用各種各樣的算法來對(duì)圖像進(jìn)行處理。根據(jù)輸入圖像得到輸出圖像運(yùn)算的數(shù)學(xué)特征則可以將圖像處理運(yùn)算方式分為以下三種:①點(diǎn)運(yùn)算;②代數(shù)運(yùn)算;③幾何運(yùn)算。本節(jié)將對(duì)這三種類型分別進(jìn)行詳細(xì)的介紹,值得注意的是,上面幾種類型的算法均屬于在空間域上的操作,與之相對(duì)應(yīng)的變換域操作則不在此進(jìn)行介紹。 1.2.2 點(diǎn)運(yùn)算 圖像的點(diǎn)運(yùn)算指將單張輸入圖像映射為單張輸出圖像,在此過程中輸出圖像每個(gè)像素點(diǎn)的灰度值只由對(duì)應(yīng)輸入圖像像素點(diǎn)的值決定。而此類點(diǎn)運(yùn)算常常用于改變圖像的灰度范圍及其分布,所以也是圖像數(shù)字化及圖像顯示的重要工具。由于其作用性質(zhì),點(diǎn)運(yùn)算也常被稱為對(duì)比度增強(qiáng)、對(duì)比度拉伸或是灰度變換。點(diǎn)運(yùn)算實(shí)質(zhì)上是一種由灰度到灰度的映射過程,設(shè)輸入圖像為 A(x),輸出圖像為 B(x),則點(diǎn)運(yùn)算可以表示為 (1.1) 換言之,點(diǎn)運(yùn)算完全由灰度映射函數(shù) f 決定。由于僅為灰度間的映射,點(diǎn)運(yùn)算不會(huì)改變圖像像素之間的空間關(guān)系。接下來我們介紹一些常見的點(diǎn)運(yùn)算方法。 1.線性點(diǎn)運(yùn)算 對(duì)于線性點(diǎn)運(yùn)算,其灰度變換函數(shù)可以描述為以下形式: (1.2)
- >
龍榆生:詞曲概論/大家小書
- >
上帝之肋:男人的真實(shí)旅程
- >
小考拉的故事-套裝共3冊
- >
李白與唐代文化
- >
煙與鏡
- >
【精裝繪本】畫給孩子的中國神話
- >
我從未如此眷戀人間
- >
朝聞道