-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
深度學習計算機視覺 版權信息
- ISBN:9787302609940
- 條形碼:9787302609940 ; 978-7-302-60994-0
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
深度學習計算機視覺 本書特色
我曾經試圖找到一本既有理論深度、知識廣度,又有技術細節、數學原理的關于深度學習的書籍,供自己學習,也推薦給我的學生學習。雖瀏覽文獻無數,但一直沒有心儀的目標。兩周前,劉升容女士將她的譯作《深度學習計算機視覺》初稿呈現給我,目的是要我從專業的角度對譯文的嚴謹性把關。粗讀一遍后,頓覺豁然開朗,油然生出得來全不費功夫之感。這大概就是我心心念念苦尋的那本書:該書對人工智能、機器學習、計算機視覺、機器視覺、神經網絡、深度學習等基本概念及其相互關系闡述透徹,解決了初學者對一些相關概念的邊界認識不清的問題;從各種神經網絡架構到網絡的訓練、評估和調參,各種技術細節深入淺出,為讀者運用深度學習方法解決不同領域的實際問題奠定了基礎;對各種網絡模型背后的數學原理的介紹直觀而細致,使得讀者可以不停留在抱著神經網絡“黑匣子”調參的階段,而是深入了解其背后的原理,進而有可能研發自己的架構;書中呈現的若干學習項目更是為讀者通過實戰提升技能創造了條件。 節選自上海大學通信與信息工程學院信息系劉學鋒教授為《深度學習計算機視覺》作的推薦序計算機如何“理解”它所“看到”的東西?本書試圖將深度學習應用于計算機視覺以回答該問題。隨書贈送源代碼和附錄,獲取地址見書封底二維碼。 原版在美亞的業內名人推薦 “從文本識別、目標檢測到DeepDream,再到人臉識別……此書內容全面又深入淺出,易于理解又與時俱進,囊括了深度學習在計算機視覺中的前沿應用!”——Bojan Djurkovic,Digital Ocean“解決現實問題又不耽溺于技術細節,以抽絲剝繭般的方式闡述概念,讓每個人都能理解。”——Burhan Ul Haq,Audit XPRT “對于任何一位想要構建實用視覺系統的人而言,這是一趟當之無愧的無價之旅。”——Richard Vaughan,Purple Monkey Collective “此書闡明了讓計算機能'看見'的黑科技背后的奧義。”——Alessandro Campeis,Vimar原版在美亞的五星好評★★★★★“現代計算機視覺綜合教程。”——Alexandr我認為本書完全可以與lan Goodfellow的《深度學習》(俗稱花書)相比。我做深度學習工程師已經5年了。我想說這是一本可以幫助讀者在現代ML(機器學習/CV(計算機視覺)領域開創職業生涯的好書。與Goodfellow的花書相比, 本書更實用,告訴了讀者如何從頭開始建立一個好的模型。本書不涉及深奧的數學背景,沒有介紹CV領域過去20年中開展的所有研究分支,只專注于目前正在行業中使用的東西。 缺點方面,我認為,要想成為優秀的CV工程師,讀者應該在學習本書之前學習一門更經典的計算機視覺課程。這樣讀者才能更好地理解應該如何在更廣闊的CV世界中運用深度學習(DL)技術。 歸根結底,本書是一本優秀的教程。它很容易理解,對深度學習技術介紹得非常棒! ★★★★★“我讀過的*好的機器學習圖書! ”——Chris Novitsky我不經常點評圖書,但我必須為本書寫書評。這本書寫得非常好,在圖示、內容安排和深度方面都處理得非常得當,并優美地介紹了機器視覺的ML(機器學習)方法。我非常推薦它! ★★★★★“從一無所有到成為英雄! ”——Amazon Customer市面上極好的計算機視覺書籍!本書非常易于閱讀和理解,涵蓋了在CV領域構建深度學習模型所需的所有基礎知識。這是一次很棒的學習體驗! ★★★★★“學習計算機視覺深度學習的牛書! ”——William我*近剛開始閱讀本書,其簡明易懂的內容令我吃驚。我讀過不少相關的書,也在網上看了一些關于深度學習的教程,尤其是CNN(卷積神經網絡)。本書并沒有向我拋出大量不帶解釋說明的數學方程,而是通過簡單的數學計算和圖表,清晰地闡明了深度學習神經網絡的工作原理。此書清除了我此前對深度學習概念的困惑。如果你是機器學習和深度學習的新手,我強烈推薦你閱讀本書! ★★★★★“條理清晰, 可讀性強。 ——Cliente Amazon此書條理清晰,可讀性強,非常適合使用深度學習技術解決計算機視覺問題的新手,并在該過程中幫助讀者理解其背后的理論。該書非常易于閱讀,且配有大量實用的圖表,絕對物有所值。 ★★★★★“通向計算機視覺的大門。 ”——3shmawei我喜歡閱讀本書的每- -刻時光。我在電信技術領域已經工作了十余年,身邊的CV應用與日俱增。我亟須一本入門書,幫助我彌補自己所缺的計算機科學基礎知識,以掌握*新的復雜CV人工智能模型。 本書通過簡明的語言闡釋復雜的科學概念,而且以圖解的方式清晰地解釋了數學公式,這使得本書成為一本真正杰出的計算機視覺教程,為我打開了通往CV領域的大門。 書中的概念解釋得簡明而專業,無論是行業專家還是學術研究人員,都會津津樂道。
深度學習計算機視覺 內容簡介
計算機視覺有多優選?開一開特斯拉就知道了。深度學習技術已在人臉識別、交互式仿真和醫學成像方面取得令人興奮的突破,但*讓人心潮澎湃的當屬自動駕駛技術。如今,自動駕駛的汽車已經能在高速路上暢意馳騁并對各種復雜路況做出靈活反應了。 計算機如何“理解”它所“看到”的東西?本書試圖將深度學習應用于計算機視覺以回答該問題。本書僅用高中代數知識闡明視覺直覺背后的概念。你將了解如何使用深度學習架構來構建視覺系統應用程序,以實現圖像生成和人臉識別功能。 主要內容 ●圖像分類和目標檢測 ●優選的深度學習架構 ●遷移學習與生成對抗網絡 ●DeepDream和神經風格遷移 ●視覺嵌入和圖像搜索
深度學習計算機視覺 目錄
第Ⅰ部分 深度學習基礎
1 章 概述3
1.1 計算機視覺 4
1.1.1 視覺感知的定義 4
1.1.2 視覺系統 4
1.1.3 感知設備 6
1.1.4 解譯設備 7
1.2 CV 應用 8
1.2.1 圖像分類 9
1.2.2 目標檢測與定位10
1.2.3 生成藝術(風格遷移) 11
1.2.4 圖像生成11
1.2.5 人臉識別12
1.2.6 圖片推薦系統13
1.3 計算機視覺管道概覽 14
1.4 圖像輸入 15
1.4.1 圖像的函數表達16
1.4.2 計算機讀取圖像17
1.4.3 彩色圖像17
1.5 圖像處理 19
1.6 特征提取 21
1.6.1 計算機視覺中特征的
定義22
1.6.2 有用特征的定義23
1.6.3 手動與自動的特征
提取25
1.7 分類器學習算法 27
1.8 本章小結 28
第2 章 深度學習和神經網絡 29
2.1 理解感知機 30
2.1.1 感知機的定義31
2.1.2 感知機的學習機制34
2.1.3 單層感知機的
局限性35
2.2 多層感知機 36
2.2.1 多層感知機架構37
2.2.2 關于隱藏層38
2.2.3 隱藏層的設計38
2.2.4 本節內容拓展40
2.3 激活函數 41
2.3.1 線性轉移函數42
2.3.2 Heaviside 階躍函數
(二元分類器) 43
2.3.3 Sigmoid/logistic
函數43
2.3.4 Softmax 函數46
2.3.5 雙_3恄黖衉J曲正切函數
2.5.1 誤差函數的定義55
2.5.2 誤差函數的意義55
2.5.3 誤差為正的必要性55
2.5.4 均方誤差損失函數56
2.5.5 交叉熵損失函數57
2.5.6 關于誤差和權重的補充
說明58
2.6 優化算法 59
2.6.1 優化的定義59
2.6.2 批梯度下降62
2.6.3 隨機梯度下降67
2.6.4 小批梯度下降68
2.6.5 梯度下降總結68
2.7 反向傳播 69
2.7.1 反向傳播的定義70
2.7.2 反向傳播總結72
2.8 本章總結 73
第3 章 卷積神經網絡75
3.1 使用MLP 進行圖像
分類 76
3.1.1 輸入層76
3.1.2 隱藏層78
3.1.3 輸出層78
3.1.4 組合78
3.1.5 MLP 處理圖像的
缺點80
3.2 CNN 架構 82
3.2.1 概述83
3.2.2 特征提取詳解84
3.2.3 分類詳解85
3.3 CNN 的基本組件 85
3.3.1 卷積層86
3.3.2 池化層或下采樣92
3.3.3 全連接層96
3.4 使用CNN 進行圖像
分類 98
3.4.1 構建模型體系架構98
3.4.2 參數(權重)的數量100
3.5 添加dropout 層以避免
過擬合 101
3.5.1 過擬合定義101
3.5.2 dropout 層定義102
3.5.3 dropout 層的重要
意義102
3.5.4 dropout 層在CNN
架構中的位置103
3.6 彩色(3D)圖像的卷積 104
3.6.1 彩色圖像的卷積105
3.6.2 計算復雜度的變化107
3.7 練習項目:彩色圖像
分類 109
3.8 本章總結 118
第4 章 構造DL 項目以及超參數
調優119
4.1 定義性能指標 120
4.1.1 選擇評價模型的*佳
指標120
4.1.2 混淆矩陣120
4.1.3 精確度和召回率121
4.1.4 F1 得分122
4.2 設計基準模型 122
4.3 為訓練準備數據 124
4.3.1 劃分數據集124
4.3.2 數據處理125
4.4 評估模型并解釋其
性能 127
4.4.1 診斷過擬合和
欠擬合127
4.4.2 繪制學習曲線129
4.4.3 練習項目:構建、
訓練和評估網絡129
4.5 網絡改進和超參數
調優 132
4.5.1 收集更多數據與超
參數調優132
4.5.2 參數與超參數133
4.5.3 神經網絡超參數133
4.5.4 網絡架構134
4.6 學習和優化 135
4.6.1 學習率及其衰減
策略135
4.6.2 找到*佳學習率的
系統性方法138
4.6.3 學習率衰減和自適應
學習138
4.6.4 小批大小139
4.7 優化算法 141
4.7.1 動量梯度下降142
4.7.2 Adam 142
4.7.3 訓練輪數和早停
標準143
4.7.4 Early stopping144
4.8 正則化技術 144
4.8.1 L2 正則化145
4.8.2 Dropout 層146
4.8.3 數據增強146
4.9 批歸一化 147
4.9.1 協變量偏移問題148
4.9.2 神經網絡中的協變量
偏移148
4.9.3 批歸一化的工作
原理149
4.9.4 批歸一化在keras 中的
實現150
4.9.5 批歸一化回顧151
4.10 練習項目:實現高準確度
的圖像分類 151
4.11 本章小結 157
第Ⅱ部分 圖像分類和檢測
第5 章 先進的CNN 架構 161
5.1 CNN 設計模式 162
5.2 LeNet-5 164
5.2.1 LeNet 架構164
5.2.2 LeNet-5 在Keras 中的
實現165
5.2.3 設置學習超參數167
5.2.4 LeNet 在MNIST 數據
集上的性能168
5.3 AlexNet 168
5.3.1 AlexNet 網絡架構169
5.3.2 AlexNet 的新特性169
5.3.3 Keras 中的AlexNet
實現171
5.3.4 設置學習超參數174
5.3.5 AlexNet 的性能174
5.4 VGGNet 175
5.4.1 VGGNet 新特性175
5.4.2 VGGNet 配置176
5.4.3 學習超參數179
5.4.4 VGGNet 性能179
5.5 Inception 和
GoogLeNet 179
5.5.1 Inception 新特性180
5.5.2 Inception 模塊:
Naive 版181
5.5.3 Inception 模塊與維數
約減182
5.5.4 Inception 體系架構184
5.5.5 GoogLeNet 的Keras
實現185
5.5.6 學習參數190
5.5.7 Inception 在CIFAR
數據集上的性能190
5.6 ResNet 191
5.6.1 ResNet 新特性191
5.6.2 殘差塊193
5.6.3 keras 中的ResNet
實現195
5.6.4 學習超參數197
5.6.5 ResNet 在CIFAR
數據集上的性能197
5.7 本章小結 198
第6 章 遷移學習199
6.1 遷移學習的必要性 200
6.2 遷移學習的定義 201
6.3 遷移學習的工作原理 207
6.3.1 神經網絡如何學習
特征208
6.3.2 網絡后期提取的特征
的可遷移性210
6.4 遷移學習方法 210
6.4.1 使用預訓練網絡作為
分類器210
6.4.2 使用預訓練網絡作為
特征提取器212
6.4.3 微調213
6.5 選擇合適的遷移學習
方法 215
6.5.1 場景1:目標數據集
較小且與源數據集
相似215
6.5.2 場景2:目標數據集
較大且與源數據集
相似216
6.5.3 場景3:目標數據集
較小且與源數據集
不同216
6.5.4 場景4:目標數據集
較大且與源數據集
不同216
6.5.5 遷移學習場景總結216
6.6 開源數據集 217
6.6.1 MNIST 217
6.6.2 Fashion-MNIST 218
6.6.3 CIFAR 218
6.6.4 ImageNet 219
6.6.5 MS COCO 221
6.6.6 Google Open
Images222
6.6.7 Kaggle222
6.7 項目1:預訓練網絡作為
特征提取器 222
6.8 項目2:微調 228
6.9 本章小結 235
第7 章 使用R-CNN、SSD 和YOLO
進行目標檢測 237
7.1 目標檢測的通用框架 238
7.1.1 候選區域239
7.1.2 網絡預測240
7.1.3 非極大值抑制
(NMS) 241
7.1.4 目標檢測器的評價
指標241
7.2 R-CNN 244
7.2.1 R-CNN 244
7.2.2 Fast R-CNN 248
7.2.3 Faster R-CNN 250
7.2.4 R-CNN 家族總結256
7.3 SSD(Single-shot
detector) 259
7.3.1 SSD 架構總覽259
7.3.2 基礎網絡261
7.3.3 多尺度特征層263
7.3.4 NMS266
7.4 YOLO(you only look
once)(320) 267
7.4.1 YOLO v3 的工作
機制268
7.4.2 YOLOv3 架構270
7.5 項目:在自動駕駛中
應用SSD 網絡 272
7.5.1 步驟1:構建模型274
7.5.2 步驟2:模型配置275
7.5.3 步驟3:創建模型276
7.5.4 步驟3:加載數據276
7.5.5 步驟5:訓練模型278
7.5.6 步驟6:可視化
損失279
7.5.7 步驟7:預測280
7.6 本章小結 281
第Ⅲ部分 生成模型與視覺嵌入
第8 章 生成對抗網絡285
8.1 GAN 架構 286
8.1.1 Deep convolutional
GANs(DCGANs) 288
8.1.2 鑒別器模型288
8.1.3 生成器模型290
8.1.4 訓練GAN 293
8.1.5 GAN 極小極大值
函數296
8.2 評估GAN 模型 297
8.2.1 Inception score298
8.2.2 Fréchet inception distance
(FID)298
8.2.3 評估方案選擇299
8.3 GAN 的主流應用 299
8.3.1 文本生成圖像(Text-tophoto
synthesis)299
8.3.2 圖像翻譯(Pix2Pix
GAN) 300
8.3.3 圖像超分辨率
GAN(SRGAN)301
8.3.4 準備好動手了嗎302
8.4 練習項目:構建自己的
GAN 302
8.5 本章小結 311
第9 章 DeepDream 和神經風格
遷移 313
9.1 打開CNN 的黑盒 314
9.1.1 CNN 工作原理
回顧314
9.1.2 CNN 特征可視化315
9.1.3 特征可視化工具的
實現318
9.2 DeepDream 321
9.2.1 DeepDream 算法的工作
原理322
9.2.2 DeepDream 的Keras
實現324
9.3 神經風格遷移 327
9.3.1 內容損失329
9.3.2 風格損失(style
loss) 330
9.3.3 總變分損失(total variance
loss)332
9.3.4 網絡訓練332
9.4 本章小結 333
第10 章 視覺嵌入335
10.1 視覺嵌入的應用 336
10.1.1 人臉識別337
10.1.2 圖片推薦系統337
10.1.3 目標重識別系統339
10.2 學習嵌入 340
10.3 損失函數 341
10.3.1 問題建立和
形式化342
10.3.2 交差熵損失342
10.3.3 對比損失343
10.3.4 三元組損失344
10.3.5 損失的簡單實現和
運行分析345
10.4 挖掘信息數據 347
10.4.1 數據加載器347
10.4.2 信息型數據挖掘:尋找
有用的三元組349
10.4.3 Batch All(BA)350
10.4.4 Batch Hard(BH) 351
10.4.5 batch weighted
(BW)353
10.4.6 Batch Sample
(BS)354
10.5 練習項目:訓練嵌入
網絡 355
10.5.1 時尚圈:查找相似的
衣服356
10.5.2 車輛重識別356
10.5.3 實現357
10.5.4 測試訓練的模型358
10.6 突破準確度的限制 362
10.7 本章小結 363
參考文獻 365
附錄A 369
A.1 下載代碼庫 369
A.2 安裝Anaconda 369
A.3 設置DL 環境 370
A.3.1 手動設置你的開發
環境370
A.3.2 使用本書的repo 中的
conda 環境371
A.3.3 保存和加載環境372
A.4 設置AWS EC2 環境 372
A.4.1 創建AWS 賬號372
A.4.2 遠程連接到此
實例373
A.4.3 運行Jupyter
Notebook374
深度學習計算機視覺 作者簡介
[埃及]穆罕默德·埃爾根迪(Mohamed Elgendy),現任Rakuten(樂天)公司的工程副總裁,掌管該公司的AI平臺和產品的開發。此前,他曾擔任Synapse Technology公司的工程主管,負責開發專用于世界范圍內安全威脅檢測的計算機視覺應用程序;后在亞馬遜建立并管理了一支中央AI團隊。該團隊充當AWS和Amazon Go等亞馬遜工程團隊的深度學習智囊團。他還在亞馬遜機器學習大學(Amazon's Machine University)開發了計算機視覺的深度學習課程。時至今日,Mohamed還經常在亞馬遜開發者大會、O'Reilly人工智能峰會和谷歌I/O大會上發表演講。
- >
二體千字文
- >
苦雨齋序跋文-周作人自編集
- >
姑媽的寶刀
- >
伯納黛特,你要去哪(2021新版)
- >
朝聞道
- >
自卑與超越
- >
大紅狗在馬戲團-大紅狗克里弗-助人
- >
回憶愛瑪儂