-
>
公路車寶典(ZINN的公路車維修與保養秘籍)
-
>
晶體管電路設計(下)
-
>
基于個性化設計策略的智能交通系統關鍵技術
-
>
花樣百出:貴州少數民族圖案填色
-
>
山東教育出版社有限公司技術轉移與技術創新歷史叢書中國高等技術教育的蘇化(1949—1961)以北京地區為中心
-
>
鐵路機車概要.交流傳動內燃.電力機車
-
>
利維坦的道德困境:早期現代政治哲學的問題與脈絡
點云數據語義分割的理論與方法 版權信息
- ISBN:9787030734884
- 條形碼:9787030734884 ; 978-7-03-073488-4
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
點云數據語義分割的理論與方法 本書特色
自動化、測繪、遙感等相關專業本科的高年級學生和研究生、從事相關研究的科技工作者。
點云數據語義分割的理論與方法 內容簡介
本書主要基于激光點云對復雜場景三維目標語義分割技術進行研究,致力于提高基于三維激光點云的語義分割技術的速度、自動化和智能化水平。本書首先根據點云獲取方式及測量原理的差異,將現有的3D點云主要可分為LiDAR點云、影像點云、RGB-D點云、結構光點云及其他類型點云,并針對每種類型點云介紹了具有代表性的數據集;在此基礎上對現有的三維點云語義分割算法進行概述和總結,分析存在的問題及技術難點,針對問題提出了快速、高效的三維目標分割方法,主要包括:三維點云混合索引Kd-OcTree的建立、融合點云與影像的深度學習語義分割技術(包括建筑物立面精細邊界語義分割算法)以及基于三維點云的深度學習語義分割技術。以上研究成果對復雜場景三維點云數據的快速處理以及三維目標智能化、高魯棒分割技術的研究起到了重要的推動作用。同時,為激光點云數據在無人駕駛、智慧城市、全球制圖等領域的應用提供了重要的技術支持。
點云數據語義分割的理論與方法 目錄
《導航與時頻技術叢書》序
前言
第1章緒論1
參考文獻3
第2章點云類型及語義分割方法概述4
2.1引言4
2.2點云類型4
2.2.1激光點云4
2.2.2影像點云13
2.2.3RGB-D點云13
2.2.4結構光點云15
2.2.5其他類型點云15
2.3點云語義分割方法概述18
2.3.1統計分析法18
2.3.2投影圖像法21
2.3.3其他傳統語義分割方法22
2.3.4二維圖像深度學習語義分割方法23
2.3.5三維點云深度學習語義分割方法28
參考文獻33
第3章深度學習40
3.1引言40
3.2深度學習技術概述40
3.2.1人工智能、機器學習與深度學習41
3.2.2卷積運算42
3.2.3卷積神經網絡工作原理43
3.2.4深度學習框架52
3.3深度學習在計算機視覺中的應用53
3.3.1圖像分類53
3.3.2目標檢測54
3.3.3語義分割54
3.3.4實例分割55
3.3.5其他應用55
3.4深度學習與三維激光點云的結合56
3.4.1三維激光點云數據的表示形式57
3.4.2三維激光點云數據集的語義標注方法57
3.4.3三維激光點云語義分割存在的挑戰58
參考文獻58
第4章LiDAR點云的組織與管理61
4.1引言61
4.2兩級混合索引結構的確定62
4.2.1全局KD樹索引62
4.2.2局部八叉樹索引64
4.3Kd-OcTree混合索引的構建65
4.3.1Kd-OcTree混合索引的邏輯結構66
4.3.2Kd-OcTree混合索引的數據結構66
4.3.3Kd-OcTree混合索引的構造算法70
4.4實驗結果與分析72
4.4.1測試數據72
4.4.2構造索引速度測試73
4.4.3鄰域搜索速度測試74
4.4.4索引結構對地面點感知效果的影響75
4.4.5閾值敏感度測試77
4.4.6不同索引結構CPU、內存消耗對比分析79
參考文獻80
第5章基于深度學習和二維圖像的多目標語義分割82
5.1引言82
5.2基于二維圖像的語義分割83
5.2.1點云描述子83
5.2.2深度卷積神經網絡85
5.2.3二維圖像與三維點云之間的映射關系85
5.2.4精細特征提取方法86
5.3研究方法87
5.3.1DVLSHR模型構建87
5.3.2二維圖像到三維點云的映射90
5.3.3三維建筑點云的精細分割91
5.4實驗結果與分析103
5.4.1數據集103
5.4.2評價標準104
5.4.3DVLSHR模型訓練105
5.4.4初步分割結果112
5.4.5映射結果可視化112
5.4.6基于三維點云的建筑物精細特征分割114
5.4.7結果分析115
參考文獻116
第6章三維點云語義分割120
6.1引言120
6.2研究現狀121
6.2.1三維數據集121
6.2.2基于點云的三維卷積神經網絡122
6.3研究方法123
6.3.1點云表示形式123
6.3.2三維深度網絡結構124
6.3.3輸入點集的順序對網絡性能的影響129
6.4實驗結果與分析130
6.4.1實驗平臺131
6.4.2評價指標131
6.4.3網絡體系結構驗證132
6.4.4分割效果136
6.4.5結果分析137
參考文獻138
第7章總結與展望140
點云數據語義分割的理論與方法 節選
第1章 緒論 隨著無人駕駛、高精地圖、智慧城市、增強現實(augmented reality, AR)、大數據等概念的提出,相關人工智能技術的持續發展以及多類型傳感器設備不斷地推陳出新,為大規模三維真實場景語義理解與分析提供了良好的發展機遇,同時使其面臨新的挑戰。語義分割作為三維場景語義理解和分析的基礎,已成為遙感、計算機視覺、機器人等多領域的研究熱點,具有重要的研究價值和廣闊的應用前景。語義分割是一種根據圖像(包括二維和 2.5維)、點云(三維)等多種數據形式的視覺內容,將其中的每一個像素或點歸類為其所屬對象的語義類別的技術。按照維度來劃分,場景語義分割的數據源包括二維圖像、 2.5維 RGB-D影像以及三維點云數據。近年來,在計算機視覺領域,語義分割的數據源基本以二維圖像為主,即圖像語義分割,已取得重大突破,這主要是因為:①大量可利用的、公開的二維圖像數據集的出現,為語義分割技術的發展提供了數據基礎;②數字成像設備具有普及性和易操作性;③圖形處理單元 (graphics processing unit, GPU)硬件技術的突破,為復雜大規模數據計算提供了保障;④二維數據維度比較低,數據處理相對容易;⑤深度學習技術促使圖像語義分割技術取得了突破性進展。 與此同時,二維圖像數據本身特點的局限性,致使它在數據獲取、處理以及分割效果方面還存在一些短板,主要包括以下方面:①在數據采集時,天氣、光照、拍攝角度直接影響圖像拍攝的精度 (精度指標為像素+色彩);②由于視角、光照、距離的不同,拍攝出的圖像色彩信息會隨之變化,分割的結果也就不同;③柔性物體在運動過程中會發生形變,致使拍攝出的圖像隨之變化;④二維圖像中點的幾何關系與相機參數 (相機位置、焦距及畸變等 )直接相關,點和點之間的相互關系不是單純的剛性旋轉和平移;⑤一般相機只能定位一個焦平面,二維圖像只具有平面特征,缺乏空間信息,單純的二維圖像無法真實再現三維場景;⑥數碼相機成像采用光學鏡頭,受三維場景復雜程度和拍攝角度的影響,采集二維圖像時目標之間存在不同程度的遮擋,這時會直接以前景色代替背景色,信息產生缺失。通過三維激光掃描儀獲取的三維點云數據恰好能彌補二維圖像的不足,其豐富的空間信息在三維場景語義理解和分析中占據著越來越重要的位置。 三維激光掃描儀直接對地物表面進行三維密集采樣,可快速獲取具有三維空間坐標和一定屬性(如強度信息、回波信息等 )的海量、不規則空間分布三維點云,稱為數字化時代下刻畫復雜現實世界昀為直接和重要的三維地理空間數據獲取手段[1]。三維激光掃描技術具有非接觸式、全天候、高精度、高速度、高分辨率等明顯優勢,具體包括如下方面:①采用主動、非接觸式掃描的激光成像原理,依據激光脈沖發射與接收的時間差或光波相位差解算三維目標到激光發射點的距離,即點云的三維坐標(X, Y, Z),不受三維場景的氣候、光照等條件的影響,具有全天時、全天候的優勢;②根據激光測量原理得到的點云,除了三維坐標,還包括激光反射強度等信息,該信息能夠反映被測三維場景中各類語義目標的表面材質和地物光譜屬性等;③通過對測站的定位定向或結合組合定位定姿技術,測量系統可以實現直接地理定位,并能快速獲取被測場景的三維點云 [2];④采用多回波技術,同一束激光照射在被測物體表面或通過被測物體間縫隙(如植被間縫隙)照射在后景物體表面,從而能夠獲取被遮擋目標的三維點云數據,實現“穿透”測量[3];⑤三維激光掃描測量人工參與少,自動化程度高;⑥每秒可以獲取十萬、百萬個點,點云密度高;⑦采用全覆蓋式測量,可獲取被測場景三維目標表面的高精度三維點云;⑧采用地面式激光掃描,單站測量只需幾分鐘,車載激光掃描每小時可采集幾十公里的街景數據,機載激光掃描效率更高。正是因為三維激光掃描技術獨*的優勢,獲取的三維點云具有廣闊的應用前景和巨大的市場需求,已廣泛應用于無人駕駛、高精地圖、電力線巡檢、森林調查、隧道信息重建、城市形態分析、數字文化遺產保護等領域。同時,其還會衍生出新的概念和領域,例如,2017年楊必勝等[1]首次提出了廣義點云的科學概念與理論研究框架。它是將多源傳感器采集的數據進行整合,以其中激光點云為基礎,采用統一基準建立集成數據、結構、功能的一體化模型,實現從多角度、視相關到全方位、視無關的目標。 傳統的三維點云語義分割技術發展已久,出現了大量經典的語義分割方法,如聚類方法、區域增長法、模板匹配法、三維霍夫變換法等。多年來,研究者雖不斷地對此進行改進、優化,卻很難有重大突破。分析其原因,傳統語義分割方法主要存在以下方面的問題:①過度依賴人工定義特征,傳統語義分割方法的點云特征描述子需要人為設置,且分割和特征提取的結果完全依賴特征的描述能力,極大地降低了三維點云的實用價值;②自動化、智能化程度低,對于傳統語義分割方法,需定義分割規則以及根據處理場景的不同設置不同的閾值,如種子點的選擇、距離閾值、法向量方向閾值、法向量夾角閾值、鄰域搜索半徑等,且在分割的過程中需要不斷人工調整閾值大小以獲取較優的分割效果;③跨平臺性差,由于(x, y)坐標對與 z坐標的對應關系不唯一以及幾何特征尺寸的差異,現有的機載激光掃描點分割方法在處理移動激光掃描點云方面存在困難 [4],跨平臺點云的分割方法魯棒性差;④提取語義類別單一,通常只提取特定類型的目標(如窗戶、陽臺等)、平面塊或感興趣的線性特征,無法有效處理包含多類別、形狀多樣、復雜程度高、包括不完整對象以及可變點密度的大規模城市場景;⑤計算量大,方法效率較低,傳統語義分割方法速度慢的主要原因是大量的三維鄰域點的查詢,而基于聚類的分割方法還無法避免鄰域搜索這一操作,已有方法開始關注如何提高分割效率的問題,如近似鄰域搜索 [5],其方法還需要進一步研究;⑥通常先濾除地面點,再提取特征,通過三維激光掃描儀獲取的三維點云,具有海量特性,點數達到千萬、億甚至十億量級,現有計算機通常無法一次處理海量點云,且地面點占比較大,為減輕計算負擔,排除地面點的干擾,通常需要先將地面點濾除,然后對剩余點云進行分割;⑦公開數據集短缺,缺少大場景三維點云公開數據集的有效支持,為解決該問題,研究者需要自己在特定場所采集數據,數據集不一致,衡量準則不統一,方法缺乏可比性,這也是導致三維場景傳統語義分割方法研究進展緩慢的主要原因之一;⑧激光點云通常只包括三維坐標和反射強度等信息,缺少豐富的光譜信息以及點與點之間的空間拓撲關系,單純依賴三維點云進行復雜場景多態目標的語義分割難度仍較大。 綜上所述,一方面,由于三維點云的真三維、高密度、海量及無結構特性,研究快速有效的大規模三維場景語義分割方法具有重要的理論價值。另一方面,由于真實自然場景的復雜程度高,三維目標間存在不同程度的重疊、遮擋及缺失,點云密度存在不均勻等現象,研究與其他領域技術的結合,提出高魯棒、強泛化能力、自動化、智能化的復雜三維場景多態目標語義分割方法對進一步推廣廣義點云技術的發展及其在各個領域的應用具有重要的現實意義。 參考文獻 [1]楊必勝, 梁福遜, 黃榮剛. 三維激光掃描點云數據處理研究進展、挑戰與趨勢 [J].測繪學報 , 2017, 46(10): 1509-1516. [2]于永濤. 大場景車載激光點云三維目標檢測算法研究 [D].廈門: 廈門大學博士學位論文 , 2015. [3]李明磊 . 面向多種平臺激光點云的線結構提取與應用技術研究 [D].鄭州: 信息工程大學博士學位論文, 2017. [4] Biosca J M, Lerma J L. Unsupervised robust planar segmentation of terrestrial laser scanner point clouds based on fuzzy clustering methods[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2008, 63(1): 84-98. [5] Hackel T, Wegner J D, Schindler K. Fast semantic segmentation of 3D point clouds with strongly varying density[J]. ISPRS Annals of Photogrammetry, Remote Sensing and Spatial Information Sciences, 2016, 3: 177-184. 第2章 點云類型及語義分割方法概述 2.1 引言 點云是指同一空間參考系下表達目標空間分布和目標表面特性的海量點的集合,具有密度大、精度高、數據量大等特點。點云除了包括三維坐標,還包括其他屬性信息,如根據激光測量原理得到的點云,還包括激光反射強度等;根據攝影測量原理得到的點云,還包括 RGB(red, green, blue)顏色信息等。本章 首先按照點云獲取方式及測量原理的不同系統介紹點云的類型,將三維點云劃分為激光點云、影像點云、 RGB-D點云、結構光點云及其他類型點云;然后對點云語義分割方法進行概述,重點介紹基于深度學習的三維點云語義分割方法。 2.2 點云類型 2.2.1 激光點云 激光點云是指由三維激光掃描儀對目標進行掃描獲取得到的海量點的集合。根據搭載三維激光掃描儀的平臺類型,激光點云可分為地面激光掃描 (terrestrial laser scanning, TLS)點云、車載激光掃描(mobile laser scanning, MLS)點云、機載激光掃描(airborne laser scanning, ALS)點云、星載激光掃描 (satellite laser scanning, SLS)點云和手持/背包式激光掃描(backpack laser scanning, BLS)點云。目前,具有代表性的激光點云數據集主要有以下 16種。 1. ISPRS benchmark ISPRS benchmark[1]數據集主要用于目標分類和三維建筑重建,由 ISPRS-Vaihingen和 ISPRS-Toronto兩個子集構成,被標注為 6個類別。其中,第1個數據集 ISPRS-Vaihingen是由德國攝影測量、遙感和地理信息學會 (Deutsche Gesellschaft für Photogrammetrie, Fernerkundung und Geoinformation, DGPF)于 2008年在韋興根 (Vaihingen)上空采用 Leica的 ALS50系統采集的機載激光點云數據。第2個數據集 ISPRS-Toronto覆蓋了加拿大多倫多 (Toronto)市中心地區約 1.45km2的區域,由微軟 Vexcel的 UCD(UltraCam-D)相機和 Optech機載激光掃描儀 ALTM-ORION M捕獲,ISPRS benchmark數據集示意圖如圖 2.1所示。 圖 2.1 ISPRS benchmark數據集示意圖 2. Oakland 3-D Oakland 3-D[2]為城市場景車載三維激光點云數據集,包含 17個文件、160萬個三維點、44類標簽。2009年,該數據集采集于賓州匹茲堡市奧克蘭的卡內基梅隆大學校園附近,車載平臺為 NavLab11,配備了側視的 SICK LMS掃描儀。數據以 ASCII格式存儲,一行表示一個點。數據集由 part2和 part3兩個子集組成,每個子集都有自己的局部參考框架,每個文件包含 10萬個三維點。對訓練集、驗證集和測試集進行濾波和標記,將 44個標簽類重新映射為 5個標簽大類。Oakland 3-D數據集全貌和車載平臺 NavLab11如圖 2.2所示
- >
史學評論
- >
李白與唐代文化
- >
回憶愛瑪儂
- >
中國人在烏蘇里邊疆區:歷史與人類學概述
- >
煙與鏡
- >
名家帶你讀魯迅:故事新編
- >
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)
- >
自卑與超越