-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
深度學習圖像搜索與識別 版權信息
- ISBN:9787121407499
- 條形碼:9787121407499 ; 978-7-121-40749-9
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
深度學習圖像搜索與識別 本書特色
適讀人群 :相關領域從業人員拍立淘是阿里巴巴推出的以圖搜圖產品,率先改變了消費者購物的方式,影響深遠。 本書圍繞該產品的技術、工程實踐,多角度、立體化地揭示了背后的技術機理: 1、首度剖析基于深度學習的億級圖像檢索技術平臺,揭示精準推薦的技術奧秘 2、深度分析計算機視覺重要算法原理與應用場景,配以詳盡的PyTorch代碼 3、闡述構建大規劃圖像搜索平臺思路、技巧與落地經驗 作者潘攀是阿里巴巴集團資深算法專家,達摩院視覺理解&互動視覺負責人,負責電商領域的視覺技術研發;拍立淘以圖搜圖的負責人和創始人之一,為拍立淘、淘寶直播&短視頻、虛擬主播、閑魚等業務提供核心技術。《深度學習圖像搜索與識別》總結了計算機視覺領域重大的落地產品實踐,獲得業界的一致好評與推崇,達摩院金榕院長、賈揚清等大咖紛紛力薦! 干貨滿滿,誠意十足,先入為快!
深度學習圖像搜索與識別 內容簡介
圖像搜索和識別是計算機視覺領域一個非常重要且基礎的題目。本書對構成圖像搜索和識別系統的各個算法基礎模塊一一做了介紹,并在*后一章以拍立淘為例說明了各個模塊是怎樣一起工作的。針對每個算法模塊,本書不僅深入淺出地解釋了算法的工作原理,還對算法背后的演進機理和不同方法的特點進行了說明,在第2章至第8章*后均提供了經典算法的PyTorch 代碼和相關參考資料。 本書既適合圖像搜索和識別領域的初學者,也適合在某個單一任務方面有經驗但是想擴充知識面的讀者。
深度學習圖像搜索與識別 目錄
1 概述 1
1.1 圖像搜索與識別概述 1
1.2 圖像搜索與識別技術的發展和應用 3
1.3 深度學習與圖像搜索和識別 4
1.4 本書結構 6
2 深度卷積神經網絡 8
2.1 概述 8
2.1.1 深度學習背景 8
2.1.2 深度卷積神經網絡 9
2.2 CNN基礎操作 11
2.2.1 卷積操作 11
2.2.2 池化操作 12
2.2.3 全連接層 13
2.2.4 激活層 14
2.2.5 批歸一化層 14
2.2.6 小結 16
2.3 常見的CNN模型結構 16
2.3.1 網絡結構超參數 17
2.3.2 單分支網絡結構 19
2.3.3 多分支網絡結構 24
2.3.4 小結 38
2.4 常見目標損失函數 38
2.5 本章總結 40
2.6 參考資料 40
3 圖像分類 43
3.1 概述 43
3.2 單標記分類 44
3.2.1 常用數據集及評價指標 44
3.2.2 損失函數 45
3.2.3 提升分類精度的實用技巧 47
3.2.4 基于搜索的圖像分類 50
3.3 細粒度圖像分類 51
3.3.1 概述 51
3.3.2 基于部件對齊的細粒度分類方法 52
3.3.3 基于高階特征池化的細粒度分類方法 55
3.3.4 小結 56
3.4 多標記圖像分類 56
3.4.1 概述 56
3.4.2 baseline:一階方法 58
3.4.3 標記關系建模 59
3.4.4 小結 60
3.5 代碼實踐 61
3.6 本章總結 63
3.7 參考資料 63
4 目標檢測 66
4.1 概述 66
4.2 兩階段目標檢測算法 68
4.2.1 候選框生成 69
4.2.2 特征抽取 71
4.2.3 訓練策略 73
4.2.4 小結 76
4.3 單階段目標檢測算法 76
4.3.1 YOLO算法 76
4.3.2 SSD算法 78
4.3.3 RetinaNet算法 81
4.3.4 無錨點框檢測算法 83
4.3.5 小結 87
4.4 代碼實踐 88
4.5 本章總結 91
4.6 參考資料 92
5 圖像分割 95
5.1 概述 95
5.2 語義分割 96
5.2.1 概述 96
5.2.2 全卷積神經網絡 97
5.2.3 空洞卷積 99
5.2.4 U-Net結構 100
5.2.5 條件隨機場關系建模 101
5.2.6 Look Wider to See Better 103
5.2.7 Atrous Spatial Pyramid Pooling算法 104
5.2.8 Context Encoding for Semantic Segmentation 104
5.2.9 多卡同步批歸一化 107
5.2.10 小結 107
5.3 實例分割 108
5.3.1 概述 108
5.3.2 FCIS 109
5.3.3 Mask R-CNN 111
5.3.4 Hybrid Task Cascade框架 113
5.3.5 小結 115
5.4 代碼實踐 115
5.5 本章總結 120
5.6 參考資料 120
6 特征學習 124
6.1 概述 124
6.2 基于分類識別的特征訓練 126
6.2.1 Sigmoid函數 127
6.2.2 Softmax函數 128
6.2.3 Weighted Softmax函數 129
6.2.4 Large-Margin Softmax函數 130
6.2.5 ArcFace函數 132
6.2.6 小結 133
6.3 基于度量學習的特征訓練 134
6.3.1 Contrastive損失函數 135
6.3.2 Triplet損失函數 137
6.3.3 三元組損失函數在行人再識別中的應用 139
6.3.4 Quadruplet損失函數 140
6.3.5 Listwise Learning 141
6.3.6 組合損失函數 142
6.3.7 小結 142
6.4 代碼實踐 143
6.5 本章總結 143
6.6 參考資料 144
7 向量檢索 147
7.1 概述 147
7.2 局部敏感哈希算法 149
7.2.1 預處理 150
7.2.2 搜索 151
7.2.3 小結 152
7.3 乘積量化系列算法 152
7.3.1 PQ算法 153
7.3.2 IVFPQ算法 155
7.3.3 OPQ算法 156
7.3.4 小結 157
7.4 圖搜索算法 157
7.4.1 NSW算法 158
7.4.2 Kgraph算法 161
7.4.3 HNSW算法 163
7.4.4 圖搜索算法實驗對比 165
7.4.5 小結 165
7.5 代碼實踐 166
7.6 本章總結 167
7.7 參考資料 168
8 圖文理解 171
8.1 概述 171
8.2 圖文識別 172
8.2.1 概述 172
8.2.2 數據集和評測標準 174
8.2.3 特征融合方法 176
8.2.4 小結 182
8.3 圖文搜索 182
8.3.1 概述 182
8.3.2 數據集和評測標準 184
8.3.3 Dual Attention Networks 185
8.3.4 Bottom-Up Attention 187
8.3.5 圖文搜索的損失函數 189
8.3.6 小結 190
8.4 代碼實踐 191
8.5 本章總結 194
8.6 參考資料 194
9 阿里巴巴圖像搜索識別系統 197
9.1 概述 197
9.2 背景介紹 198
9.3 圖像搜索架構 200
9.3.1 類目預測模塊 200
9.3.2 目標檢測和特征聯合學習 201
9.3.3 圖像索引和檢索 205
9.4 實驗和結果分析 207
9.5 本章總結 210
9.6 參考資料 211
深度學習圖像搜索與識別 作者簡介
潘攀,花名啟磐。 阿里巴巴集團資深算法專家,達摩院視覺理解&互動視覺負責人,負責電商領域的視覺技術研發。 拍立淘以圖搜圖的負責人和創始人之一,為拍立淘、淘寶直播&短視頻、虛擬主播、閑魚等業務提供核心技術。 博士畢業于美國伊利諾伊大學芝加哥分校,研究領域包括深度學習和計算機視覺等。 曾先后在美國三菱研究院和北京富士通研發中心從事視覺技術研發工作。 已發表20余篇論文,擁有10余授權專利,并獲得WebVision分類,COCO檢測,DAVIS分割等國際計算機視覺競賽冠軍。
- >
伊索寓言-世界文學名著典藏-全譯本
- >
詩經-先民的歌唱
- >
姑媽的寶刀
- >
自卑與超越
- >
【精裝繪本】畫給孩子的中國神話
- >
中國歷史的瞬間
- >
龍榆生:詞曲概論/大家小書
- >
小考拉的故事-套裝共3冊