-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
人體目標檢測與識別方法及應用 版權信息
- ISBN:9787030692191
- 條形碼:9787030692191 ; 978-7-03-069219-1
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
人體目標檢測與識別方法及應用 內容簡介
本書針對人體目標檢測與識別的技術要求,以傳統的統計模式識別方法和近期新的深度學習方法為主線,主要包括目標檢測與識別的現狀、人臉檢測與識別、人體疲勞狀態監測、快速行人檢測、手指靜脈識別和人臉表情識別等內容,全書特色鮮明、內容系統、實例豐富,力求從實用的角度為讀者呈現視覺目標檢測與識別的方法創新、技術實現、實驗驗證和應用開發的完整流程。 本書適合相關專業本科高年級學生、研究生、廣大模式識別與計算機視覺愛好者,以及從事視覺檢測與識別技術研發的科研人員和高新技術企業研發人員閱讀,為其提供學習與工作上的技術參考。
人體目標檢測與識別方法及應用 目錄
**章 目標檢測和識別方法概論 1
1.1 目標檢測方法國內外研究現狀 1
1.1.1 傳統的目標檢測方法研究現狀 1
1.1.2 基于卷積神經網絡的目標檢測方法研究現狀 2
1.2 目標識別方法國內外研究現狀 4
1.2.1 傳統的目標識別方法研究現狀 4
1.2.2 基于卷積神經網絡的目標識別方法研究現狀 5
1.3 目標檢測和識別應用前景 5
第二章 基于統計特征的人體目標檢測方法 7
2.1 基于膚色的尺度自適應人臉檢測 7
2.1.1 視頻圖像預處理 7
2.1.2 人臉檢測算法 9
2.1.3 基于人臉膚色統計的坐姿監測 17
2.2 人體疲勞狀態監測方法 19
2.2.1 基于融合邊緣的打哈欠判別 20
2.2.2 人眼與瞳孔檢測及閉眼判別 26
2.2.3 輔助駕駛系統中頭部狀態與疲勞監測 29
2.2.4 實驗結果與分析 35
2.3 基于稀疏表示的兩級級聯快速行人檢測 38
2.3.1 HOG特征和V_edge_sym特征 39
2.3.2 **級分類算法 43
2.3.3 第二級分類算法 44
2.3.4 實驗結果與分析 48
第三章 基于統計特征的人體目標識別方法 53
3.1 基于稀疏表示的靜態人臉識別 53
3.1.1 基于稀疏表示的人臉識別方法的基本原理 53
3.1.2 基于GLC-KSVD的稀疏表示人臉識別算法 54
3.1.3 融合特征結合子模字典學習的稀疏表示人臉識別算法 62
3.2 基于主動紅外視頻的活體人臉識別 69
3.2.1 系統概述 69
3.2.2 迭代二次幀差模型 70
3.2.3 PCA預訓練特征模型 72
3.2.4 *近鄰余弦相似度分類器 73
3.2.5 實驗結果及分析 73
第四章 基于深度學習的人體目標檢測方法 79
4.1 研究背景與意義 79
4.2 基于深度學習的人體目標檢測研究歷史 80
4.3 常用公開目標檢測數據庫 82
4.4 基于深度學習的目標檢測模型簡介 82
4.4.1 人工神經網絡算法原理 83
4.4.2 卷積神經網絡基礎 86
4.4.3 基于回歸的目標檢測 89
4.4.4 基于候選區域的目標檢測 91
4.5 基于MS+KCF的快速人臉檢測 95
4.5.1 系統總體流程 96
4.5.2 MobileNet-SSD網絡相關原理 96
4.5.3 KCF算法原理 102
4.5.4 實驗結果及分析 103
第五章 基于深度學習的人體目標識別方法 108
5.1 基于深度學習的人臉表情識別 108
5.1.1 一種基于深度學習的人臉表情識別算法 108
5.1.2 人臉身份保持表情不變性特征研究 114
5.2 基于多尺度核特征卷積神經網絡的實時人臉表情識別 119
5.2.1 實時人臉表情識別系統概述 120
5.2.2 快速穩定的人臉檢測 120
5.2.3 多尺度核特征人臉表情識別網絡 122
5.2.4 實驗結果及分析 125
5.3 基于深度學習的行人重識別 129
5.3.1 行人重識別概述 129
5.3.2 結合全局與局部特征的行人重識別方法 133
第六章 深度學習平臺 145
6.1 深度學習框架 145
6.1.1 Caffe框架 145
6.1.2 TensorFlow框架 145
6.1.3 MXNet框架 145
6.1.4 Keras框架 146
6.2 深度學習平臺搭建 146
6.2.1 Ubuntu16.04(U盤引導安裝) 146
6.2.2 安裝搜狗拼音 147
6.2.3 安裝NVIDIA驅動 147
6.2.4 安裝CUDA9.0+cuDNN7.1.4+Tensorflow1.8.0+Python3.5 149
6.2.5 安裝PyCharm+配置Python3.5+安裝OpenCV3.2 153
第七章 綜合應用與分析 156
7.1 近紅外活體人臉檢測系統 156
7.1.1 系統平臺搭建 156
7.1.2 系統運行過程 157
7.1.3 系統測試結果 157
7.2 人體疲勞狀態監測系統 157
7.2.1 系統平臺搭建 158
7.2.2 系統運行過程 158
7.2.3 系統測試結果 158
7.3 智能情緒監控輔助駕駛系統 159
7.3.1 系統平臺搭建 160
7.3.2 系統運行過程 161
7.3.3 系統測試結果 161
參考文獻 164
人體目標檢測與識別方法及應用 節選
**章 目標檢測和識別方法概論 1.1 目標檢測方法國內外研究現狀 1.1.1 傳統的目標檢測方法研究現狀 傳統的目標檢測方法首先需要人工選擇特征,如Haar特征、局部二值模式(local binary pattern,LBP)、尺度不變特征變換(scale-invariant feature transform,SIFT)和方向梯度直方圖(histogram of oriented gradient,HOG)及協方差矩陣(covariance matrix,CM)等;然后對目標進行分類,常用的分類器有自適應增強(adaptive boosting,AdaBoost)和支持向量機(support vector machine,SVM)等。 Haar特征*初由 Papageorgiou等(1998)提出,隨后Viola和Jones(2001)提出利用積分圖來提高Haar特征的運算速度的方法,并通過構建級聯分類器,從而實現快速精確的人臉定位。之后,Lienhart和Maydt等(2002)在Haar特征庫中加入旋轉45°的矩形特征,用于擴展特征的多樣性,進一步提高檢測的精確度。LBP特征由Ojala等(2002)提出,用于提取圖像的局部紋理特征。它具有旋轉和灰度不變性,對于人臉檢測簡單且有效,其改進算法局部三值模式(local ternary pattern,LTP)、改進中心對稱二值模式(improved center symmetric local binary pattern,ICS-LBP)等(Yeffet and Wolf,2009;Zheng et al.,2010)在行人檢測中被廣泛應用。SIFT特征由Lowe(2004)提出,SIFT特征是具有尺度不變性的局部特征描述算子,對光照、噪聲等具有良好的魯棒性,應用于基于特征點匹配的目標檢測中,對于部分遮擋的目標物體也具有較好的檢出率。由于SIFT特征良好的效果,派生出許多類似的特征算子,如FAST、BRISK、ORB和FREAK等(Trajkovic and Hedley,1998;Leutenegger et al.,2011;Rublee et al.,2011;Ortiz et al.,2012)。HOG特征由Dalal和Triggs(2005)提出,現被廣泛應用于行人檢測領域,該特征用于描述目標物體的邊緣梯度信息,能夠很好地表達目標物體的特征。CM描述子由Tuzel等(2006)提出,*先用于物體的識別和紋理分類。CM特征將區域內梯度的方向、強度、位置等有效信息之間的相關性,以編碼的形式融入協方差矩陣中,因此適合具有復雜結構的目標的檢測。Tuzel等(2008)指定對稱正定的CM描述子對應的特征空間為黎曼流形(Riemannian manifold),并將黎曼流形映射到切平面上進行線性分類,此種方法可被應用于人體的檢測,在法國國家信息與自動化研究所數據集(Laptev et al.,2008)上,比較之前的HOG方法,具有較低的漏檢率。 綜上所述,用于目標檢測的單一的特征還有很多,但單一的特征并不能完全地表達出所檢測目標的信息,許多研究者采用多種特征融合的方式,來提高目標檢測的性能。Nanni和Lumini(2008)分別針對LBP特征、Gabor特征以及拉普拉斯特征圖訓練出不同分類器,進行決策級融合,提高了目標檢測的檢出率。Wojek等(2009)對HOG特征、Haar特征以及光流HOG特征進行特征級融合,獲得了較高的檢測效果。 AdaBoost分類器是傳統的目標檢測方法常用的分類器,由Schapire等(1998)提出,*初是基于Haar-like特征設計的,隨后研究人員用AdaBoost結合其他特征,如APCF (associated pairing comparison features,聯合塊比較特征值提取)法、積分通道以及多特征等(Duan et al.,2009;Dollar et al.,2009;黃如錦 等,2010),取得更好的分類效果,如MPLBoost(Viola et al.,2005),DadaBoost(Gao et al.,2012)等。 SVM分類器是目前應用*廣泛的分類器之一,由Cortes和Vapnik在1995年首次提出。它的優勢在于可解決小樣本、非線性、高維度的模式分類問題,和神經網絡類似,都是學習性的機制。其不僅廣泛應用于傳統的目標檢測方法,而且用于基于深度學習的目標檢測中。其中具有代表性的是Felzenszwalb等(2010a)提出的基于HOG的變形組件模型 (deformable parts model,DPM)目標檢測算法,利用SVM作為分類器,連續獲得2007~ 2009年PASCAL VOC(Everingham,2006)目標檢測競賽**名。 傳統的目標檢測方法都具有以下特點:①需要人工選擇特征,其過程復雜,目標檢測效果的優劣完全取決于研究人員的先驗知識;②以窗口遍歷圖像的方式檢測目標,在檢測過程中有很多冗余窗口,時間復雜度高,并且對圖像序列中尺度較小、遮擋較為嚴重、角度變化較大的目標檢測效果欠佳;③時間復雜度較低,參數較少,因此在系統中消耗的內存較少,便于與深度學習的方法相結合,能高效地完成所需功能的程序的開發,如活體檢測、降低參數維度和分類器級聯等功能。 1.1.2 基于卷積神經網絡的目標檢測方法研究現狀 近年來,深度學習在目標檢測領域中取得巨大突破,成為目前較先進的方法,LeCun等(2014)提出**個卷積神經網絡(convolutional neural network,CNN)模型——LeNet-5 (2014),其參數共享機制解決了神經網絡參數過多及訓練不足問題。Hinton和Salakhutdinov (2006)在Science上率先提出深度學習的概念,2015年又在Nature上闡述了深度學習的前世今生(LeCun et al.,2015),引領了機器視覺、模式識別和人工智能等領域的發展(Silver et al.,2017;Athalye et al.,2018)。2012~2017年VGGNet(Simonyan and Zisserman,2015)、ResNet(He et al.,2016)、DenseNet(Huang G et al.,2017)等*具有代表性的基礎網絡相繼出現,在ImageNet競賽(Deng et al.,2009)中取得了極好的分類效果。 CNN在目標檢測上的標志性成果是Girshick等在2015年提出的R-CNN(region-based CNN)網絡,在VOC數據集上(Everingham et al.,2015)測試的平均精度是DPM算法的兩倍。此后基于CNN的目標檢測方法占有主導地位,主要分為兩大類:①基于候選區域(region proposal,RP)的方法,代表作是SPP-net(He et al.,2015b)、Fast R-CNN(Girshick,2015)、Faster R-CNN(Ren et al.,2017)、R-FCN(Dai et al.,2016)和Mask R-CNN(He et al.,2017)等;②基于回歸的方法,代表作是YOLO(you only look once)(Redmon et al.,2016)和SSD(single shot multibox detector)(Liu et al.,2016;Wong et al.,2018)等。 2015年He等提出的SPP-net網絡利用空間金字塔的池化解決RP縮放的問題,且只需要一次特征提取過程,比R-CNN快24~102倍,但訓練煩瑣,且檢測效果不好。2015年Girshick等提出的Fast R-CNN網絡將多任務的損失函數聯合在一起,提高了檢測精度,檢測速度比R-CNN快213倍,但這是一個不完全端對端的方法,仍不滿足實時性。2017年Ren等提出的Faster R-CNN是完全端對端的訓練,用RPN(region proposal network)網絡結構代替了選擇性搜索等方法,全卷積的RPN和Fast R-CNN網絡交替訓練,實現卷積特征共享,也使得兩個網絡快速收斂,具有更高的檢測精度,在Tesla k40上的檢測速度為5~17幀/s,缺點是全連接層的計算不共享,重復計算成本較高。2017年He提出的Mask R-CNN在Faster R-CNN的基礎上增加了一個用于實例分割任務的Mask網絡,集目標檢測與分割為一體,多任務的損失函數使訓練更加簡單,且具有關鍵點檢測功能,提高了檢測的精度,但其速度還無法滿足高性能實時性應用場合的需求。Redmon等(2016)提出使用YOLO網絡同時進行分類和定位,在Titan X上可達45幀/s,但是對小、密集和形變較大的目標召回率較低,原因在于其沒有選擇RP的過程,是以犧牲精度來提升網絡速度的。 Dai等(2016)提出的R-FCN網絡解決了分類任務要求平移不變性和定位任務要求平移可變性的矛盾,用共享計算的全卷積取代了不共享計算的全連接層,提高了檢測速度,是一個簡單、精確、有效的目標檢測的框架。Liu等(2016)提出的單階段多框目標檢測器(single shot multibox detector,SDD)網絡是一個回歸網絡,用單一的網絡進行多任務的預測,在Titan X上測試速度為59幀/s,并且結合在不同層次的卷積特征圖,具有較高的檢測精度。He等(2017)提出FPN算法,利用CNN的高低層特征圖的語義關系,將特征圖由底到頂和由頂到底加性結合,形成特征圖金字塔,具有較高的分類精度。在2018年的CVPR(Computer Vision and Pattern Recognition,計算機視覺與模式識別)會議上,Zhang S等(2018)在SSD算法的基礎上添加分割模塊和全局激活模塊提高了低層和高層卷積特征圖的語義信息,兼顧了目標檢測精度和速度。Redmon和Farhadi(2018)提出YOLOv3算法,在YOLO的基礎上,利用三個不同層次的特征圖,經過多次DBL模塊后相級聯得到三個尺度的預測層,再結合多尺度的候選區域框,不但增加了特征圖的維度,加強了特征的語義信息,而且提高了對目標細節信息的表達能力,對于非顯著目標具有較高的檢測精度和速度。以上網絡具有兩個共同的優點:①利用多任務的損失函數形成端對端的網絡結構,加快了訓練時參數的學習速度,提高了測試的精度;②使用不同層次的卷積特征圖用于提高檢測精度。較淺的卷積層的感受野較小,學習局部區域的特征,具有豐富的空間信息,滿足定位任務需要的平移可變性;較深的卷積層,其感受野較大,學習更加抽象的特征,具有充足的語義信息,對目標在圖像中的位置具有魯棒性,滿足分類任務需要的平移不變性。以上兩個優點對現實環境中小尺度、遮擋較為嚴重和角度變化較大的目標物體的檢測具有較高的檢測精度和速度。 在基于CNN的目標檢測方法中,用于提取特征圖的網絡被稱為基礎網絡(如VGG、ResNet等),而用于分類回歸和邊界框回歸的結構被稱為元結構(如Faster R-CNN、R-FCN、SSD等)。因此,不同的基礎網絡和元結構的組合具有不同的檢測效果,Huang J等(2017)詳細闡述了元結構的檢測精度與速度之間折中的方法。Howard等(2017)提出的基礎網絡MobileNet以犧牲少量的分類精度換取大量的參數減少,其參數數量僅是VGG16的1/33,而且在ImageNet的分類正確率比VGG16高0.1%。為了兼顧檢測速度和精度,若將MobileNet等參數少、層次深的基礎網絡與兼具分類平移不變性和定位平移可變性的元結構相結合,極有可能同時提高目標物體的檢測速度和精度。 1.2 目標識別方法國內外研究現狀
- >
經典常談
- >
山海經
- >
推拿
- >
巴金-再思錄
- >
羅庸西南聯大授課錄
- >
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)
- >
姑媽的寶刀
- >
回憶愛瑪儂