目 錄第1章 引言 11.1 動機 11.2 計算機視覺為什么是困難的21.3 圖像表達(dá)與圖像分析的任務(wù)41.4 總結(jié) 71.5 習(xí)題 71.6 參考文獻(xiàn) 8第2章 圖像及其表達(dá)與性質(zhì) 92.1 圖像表達(dá)若干概念 92.2 圖像數(shù)字化 112.2.1 采樣 112.2.2 量化 122.3 數(shù)字圖像性質(zhì) 132.3.1 數(shù)字圖像的度量和拓?fù)湫再|(zhì) 132.3.2 直方圖 172.3.3 熵 182.3.4 圖像的視覺感知 182.3.5 圖像品質(zhì) 202.3.6 圖像中的噪聲 212.4 彩色圖像 222.4.1 色彩物理學(xué) 222.4.2 人所感知的色彩 232.4.3 彩色空間 262.4.4 調(diào)色板圖像 282.4.5 顏色恒常性 282.5 攝像機概述 292.5.1 光敏傳感器 292.5.2 黑白攝像機 302.5.3 彩色攝像機 322.6 總結(jié) 322.7 習(xí)題 332.8 參考文獻(xiàn) 35第3章 圖像及其數(shù)學(xué)與物理背景 373.1 概述 373.1.1 線性 373.1.2 狄拉克(dirac)分布和卷積 373.2 積分線性變換 383.2.1 作為線性系統(tǒng)的圖像393.2.2 積分線性變換引言393.2.3 1d傅里葉變換 393.2.4 2d傅里葉變換 433.2.5 采樣與香農(nóng)約束 453.2.6 離散余弦變換 473.2.7 小波變換 483.2.8 本征分析 523.2.9 奇異值分解 533.2.10 主分量分析 543.2.11 radon變換563.2.12 其他正交圖像變換563.3 作為隨機過程的圖像 573.4 圖像形成物理 593.4.1 作為輻射測量的圖像593.4.2 圖像獲取與幾何光學(xué)603.4.3 鏡頭像差和徑向畸變633.4.4 從輻射學(xué)角度看圖像獲取 653.4.5 表面反射 673.5 總結(jié) 693.6 習(xí)題 703.7 參考文獻(xiàn) 71第4章 圖像分析的數(shù)據(jù)結(jié)構(gòu) 734.1 圖像數(shù)據(jù)表示的層次 734.2 傳統(tǒng)圖像數(shù)據(jù)結(jié)構(gòu) 744.2.1 矩陣 744.2.2 鏈 764.2.3 拓?fù)鋽?shù)據(jù)結(jié)構(gòu) 764.2.4 關(guān)系結(jié)構(gòu) 774.3 分層數(shù)據(jù)結(jié)構(gòu) 784.3.1 金字塔 784.3.2 四叉樹 794.3.3 其他金字塔結(jié)構(gòu) 804.4 總結(jié) 814.5 習(xí)題 824.6 參考文獻(xiàn) 83第5章 圖像預(yù)處理 855.1 像素亮度變換 855.1.1 位置相關(guān)的亮度校正855.1.2 灰度級變換 865.2 幾何變換 885.2.1 像素坐標(biāo)變換 885.2.2 亮度插值 895.3 局部預(yù)處理 915.3.1 圖像平滑 915.3.2 邊緣檢測算子 975.3.3 二階導(dǎo)數(shù)過零點1005.3.4 圖像處理中的尺度1045.3.5 canny邊緣提取1055.3.6 參數(shù)化邊緣模型1075.3.7 多光譜圖像中的邊緣1075.3.8 頻域的局部預(yù)處理1085.3.9 用局部預(yù)處理算子作線檢測 1125.3.10 角點(興趣點)檢測1135.3.11 *大穩(wěn)定極值區(qū)域檢測 1165.4 圖像復(fù)原 1175.4.1 容易復(fù)原的退化1185.4.2 逆濾波 1185.4.3 維納濾波 1185.5 總結(jié) 1205.6 習(xí)題 1215.7 參考文獻(xiàn) 126第6章 分割ⅰ 1306.1 閾值化 1306.1.1 閾值檢測方法 1326.1.2 *優(yōu)閾值化 1336.1.3 多光譜閾值化 1356.2 基于邊緣的分割 1366.2.1 邊緣圖像閾值化1376.2.2 邊緣松弛法 1386.2.3 邊界跟蹤 1396.2.4 作為圖搜索的邊緣跟蹤1436.2.5 作為動態(tài)規(guī)劃的邊緣跟蹤 1496.2.6 hough變換1526.2.7 使用邊界位置信息的邊界???檢測 1576.2.8 從邊界構(gòu)造區(qū)域 1576.3 基于區(qū)域的分割 1596.3.1 區(qū)域歸并 1606.3.2 區(qū)域分裂 1616.3.3 分裂與歸并 1626.3.4 分水嶺分割 1656.3.5 區(qū)域增長后處理1676.4 匹配 1676.4.1 模版匹配 1686.4.2 模版匹配的控制策略1706.5 分割的評測問題 1706.5.1 監(jiān)督式評測 1716.5.2 非監(jiān)督式評測 1736.6 總結(jié) 1746.7 習(xí)題 1766.8 參考文獻(xiàn) 178第7章 分割ⅱ 1857.1 均值移位分割 1857.2 活動輪廓模型——蛇行1907.2.1 經(jīng)典蛇行和氣球1917.2.2 擴展 1937.2.3 梯度矢量流蛇 1947.3 幾何變形模型——水平集和測地?? 活動輪廓 1987.4 模糊連接性 2037.5 面向基于3d圖的圖像分割 2087.5.1 邊界對的同時檢測2087.5.2 次優(yōu)的表面檢測2117.6 圖割分割 2127.7 *優(yōu)單和多表面分割2177.8 總結(jié) 2277.9 習(xí)題 2287.10 參考文獻(xiàn) 229第8章 形狀表示與描述 2378.1 區(qū)域標(biāo)識 2398.2 基于輪廓的形狀表示與描述2418.2.1 鏈碼 2418.2.2 簡單幾何邊界表示2428.2.3 邊界的傅里葉變換2458.2.4 使用片段序列的邊界描述 2468.2.5 b樣條表示 2498.2.6 其他基于輪廓的形狀描述???方法 2508.2.7 形狀不變量 2518.3 基于區(qū)域的形狀表示與描述2538.3.1 簡單的標(biāo)量區(qū)域描述2548.3.2 矩 2578.3.3 凸包 2598.3.4 基于區(qū)域骨架的圖表示2628.3.5 區(qū)域分解 2668.3.6 區(qū)域鄰近圖 2678.4 形狀類別 2688.5 總結(jié) 2688.6 習(xí)題 2708.7 參考文獻(xiàn) 272第9章 物體識別 2789.1 知識表示 2789.2 統(tǒng)計模式識別 2819.2.1 分類原理 2829.2.2 *近鄰 2839.2.3 分類器設(shè)置 2859.2.4 分類器學(xué)習(xí) 2879.2.5 支持向量機 2889.2.6 聚類分析 2919.3 神經(jīng)元網(wǎng)絡(luò) 2939.3.1 前饋網(wǎng)絡(luò) 2949.3.2 非監(jiān)督學(xué)習(xí) 2959.3.3 hopfield神經(jīng)元網(wǎng)絡(luò) 2969.4 句法模式識別 2979.4.1 語法與語言 2989.4.2 句法分析與句法分類器3009.4.3 句法分類器學(xué)習(xí)與語法推導(dǎo) 3019.5 作為圖匹配的識別 3029.5.1 圖和子圖的同構(gòu)3039.5.2 圖的相似度 3059.6 識別中的優(yōu)化技術(shù) 3069.6.1 遺傳算法 3079.6.2 模擬退火 3089.7 模糊系統(tǒng) 3099.7.1 模糊集和模糊隸屬函數(shù)3109.7.2 模糊集運算 3119.7.3 模糊推理 3129.7.4 模糊系統(tǒng)設(shè)計與訓(xùn)練3149.8 模式識別中的boosting方法 3159.9 隨機森林 3179.9.1 隨機森林訓(xùn)練 3189.9.2 隨機森林決策 3219.9.3 隨機森林?jǐn)U展 3229.10 總結(jié) 3229.11 習(xí)題 3259.12 參考文獻(xiàn) 330第10章 圖像理解 33510.1 圖像理解控制策略33610.1.1 并行和串行處理控制33610.1.2 分層控制 33710.1.3 自底向上的控制33710.1.4 基于模型的控制33710.1.5 混合的控制策略33810.1.6 非分層控制 34110.2 sift:尺度不變特征轉(zhuǎn)換 34210.3 ransac:通過隨機抽樣一致來???擬合 34410.4 點分布模型 34710.5 活動表觀模型 35510.6 圖像理解中的模式識別方法 36210.6.1 基于分類的分割36210.6.2 上下文圖像分類36410.6.3 梯度方向直方圖-hog36710.7 boosted層疊分類器用于快速物體???檢測 37010.8 基于隨機森林的圖像理解37210.9 場景標(biāo)注和約束傳播37710.9.1 離散松弛法 37810.9.2 概率松弛法 37910.9.3 搜索解釋樹 38110.10 語義圖像分割和理解38210.10.1 語義區(qū)域增長38310.10.2 遺傳圖像解釋38410.11 隱馬爾可夫模型39010.11.1 應(yīng)用 39410.11.2 耦合的hmm39410.11.3 貝葉斯信念網(wǎng)絡(luò)39510.12 馬爾科夫隨機場397?10.12.1 圖像和視覺的應(yīng)用 39810.13 高斯混合模型和期望*大化 39910.14 總結(jié) 40410.15 習(xí)題 40710.16 參考文獻(xiàn) 410第11章 3d幾何,對應(yīng),從亮度到3d 41911.1 3d視覺任務(wù) 41911.1.1 marr理論42111.1.2 其他視覺范疇:主動和有目的的視覺 42211.2 射影幾何學(xué)基礎(chǔ) 42311.2.1 射影空間中的點和超平面 42411.2.2 單應(yīng)性 42611.2.3 根據(jù)對應(yīng)點估計單應(yīng)性 42711.3 單透視攝像機 43011.3.1 攝像機模型 43011.3.2 齊次坐標(biāo)系中的投影和反投影 43211.3.3 從已知場景標(biāo)定一個攝像機 43211.4 從多視圖重建場景43311.4.1 三角測量 43311.4.2 射影重建 43411.4.3 匹配約束 43511.4.4 光束平差法 43611.4.5 升級射影重建和自標(biāo)定 43711.5 雙攝像機和立體感知43811.5.1 極線幾何學(xué)——基本矩陣 43811.5.2 攝像機的相對運動——本質(zhì)矩陣 44011.5.3 分解基本矩陣到攝像機矩陣 44111.5.4 從對應(yīng)點估計基本矩陣 44111.5.5 雙攝像機矯正結(jié)構(gòu)44211.5.6 矯正計算 44411.6 三攝像機和三視張量44511.6.1 立體對應(yīng)點算法44611.6.2 距離圖像的主動獲取45111.7 由輻射測量到3d信息 45311.7.1 由陰影到形狀45311.7.2 光度測量立體視覺45511.8 總結(jié) 45611.9 習(xí)題 45711.10 參考文獻(xiàn) 459第12章 3d視覺的應(yīng)用 46412.1 由x到形狀 46412.1.1 由運動到形狀46412.1.2 由紋理到形狀46812.1.3 其他由x到形狀的技術(shù) 46912.2 完全的3d物體 47112.2.1 3d物體、模型以及相關(guān)問題 47112.2.2 線條標(biāo)注 47212.2.3 體積表示和直接測量47412.2.4 體積建模策略47512.2.5 表面建模策略47612.2.6 為獲取完整3d模型的面元標(biāo)注與融合 47812.3 3d場景的2d視圖表達(dá) 48212.3.1 觀察空間 48212.3.2 多視圖表達(dá)和示象圖48212.4 從無組織的2d視圖集合進(jìn)行3d重建,從運動到結(jié)構(gòu) 48312.5 重建場景幾何 48512.6 總結(jié) 48712.7 習(xí)題 48712.8 參考文獻(xiàn) 488第13章 數(shù)學(xué)形態(tài)學(xué) 49313.1 形態(tài)學(xué)基本概念 49313.2 形態(tài)學(xué)四原則 49413.3 二值膨脹和腐蝕 49513.3.1 膨脹 49513.3.2 腐蝕 49713.3.3 擊中擊不中變換49813.3.4 開運算和閉運算49913.4 灰度級膨脹和腐蝕49913.4.1 頂面、本影、灰度級膨脹和腐蝕 50013.4.2 本影同胚定理和膨脹、腐蝕及開、閉運算的性質(zhì) 50213.4.3 頂帽變換 50213.5 骨架和物體標(biāo)記 50313.5.1 同倫變換 50313.5.2 骨架、中軸和*大球50313.5.3 細(xì)化、粗化和同倫骨架 50513.5.4 熄滅函數(shù)和*終腐蝕50613.5.5 *終腐蝕和距離函數(shù)50813.5.6 測地變換 50913.5.7 形態(tài)學(xué)重構(gòu) 51013.6 粒度測定法 51113.7 形態(tài)學(xué)分割與分水嶺51313.7.1 粒子分割、標(biāo)記和分水嶺 51313.7.2 二值形態(tài)學(xué)分割51313.7.3 灰度級分割和分水嶺51513.8 總結(jié) 51613.9 習(xí)題 51713.10 參考文獻(xiàn) 518第14章 圖像數(shù)據(jù)壓縮 52014.1 圖像數(shù)據(jù)性質(zhì) 52114.2 圖像數(shù)據(jù)壓縮中的離散圖像變換 52114.3 預(yù)測壓縮方法 52314.4 矢量量化 52514.5 分層的和漸進(jìn)的壓縮方法52514.6 壓縮方法比較 52614.7 其他技術(shù) 52714.8 編碼 52714.9 jpeg和mpeg圖像壓縮 52814.9.1 jpeg——靜態(tài)圖像壓縮 52814.9.2 jpeg-2000壓縮 52914.9.3 mpeg——全運動的視頻壓縮 53114.10 總結(jié) 53214.11 習(xí)題 53314.12 參考文獻(xiàn) 535第15章 紋理 53715.1 統(tǒng)計紋理描述 53915.1.1 基于空間頻率的方法53915.1.2 共生矩陣 54015.1.3 邊緣頻率 54115.1.4 基元長度(行程)54215.1.5 laws紋理能量度量 54315.1.6 局部二值模式(lbps) 54415.1.7 分形紋理描述54715.1.8 多尺度紋理描述——小波域方法 54915.1.9 其他紋理描述的統(tǒng)計方法 55115.2 句法紋理描述方法55215.2.1 形狀鏈語法 55315.2.2 圖語法 55415.2.3 分層紋理中的基元分組 55515.3 混合的紋理描述方法55615.4 紋理識別方法的應(yīng)用55715.5 總結(jié) 55715.6 習(xí)題 55915.7 參考文獻(xiàn) 561第16章 運動分析 56616.1 差分運動分析方法56816.2 光流 57116.2.1 光流計算 57116.2.2 全局和局部光流估計57316.2.3 局部和全局相結(jié)合的光流估計 57516.2.4 運動分析中的光流57516.3 基于興趣點對應(yīng)關(guān)系的分析 57816.3.1 興趣點的檢測57816.3.2 lucas-kanade點跟蹤 57816.3.3 興趣點的對應(yīng)關(guān)系58016.4 特定運動模式的檢測58216.5 視頻跟蹤 58516.5.1 背景建模 58516.5.2 基于核函數(shù)的跟蹤58816.5.3 目標(biāo)路徑分析59216.6 輔助跟蹤的運動模型59616.6.1 卡爾曼濾波器59616.6.2 粒子濾波器 60016.6.3 半監(jiān)督跟蹤——tld60316.7 總結(jié) 60516.8 習(xí)題 60716.9 參考文獻(xiàn) 608詞匯 613