中图网(原中国图书网):网上书店,中文字幕在线一区二区三区,尾货特色书店,中文字幕在线一区,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
GPU編程實戰 基于Python和CUDA

包郵 GPU編程實戰 基于Python和CUDA

出版社:人民郵電出版社出版時間:2022-06-01
開本: 24cm 頁數: 244頁
讀者評分:4分1條評論
中 圖 價:¥48.9(6.1折) 定價  ¥79.9 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>
買過本商品的人還買了

GPU編程實戰 基于Python和CUDA 版權信息

GPU編程實戰 基于Python和CUDA 本書特色

適讀人群 :有一定Python基礎,對GPU感興趣的讀者。1.本書基于Python和CUDA介紹GPU編程2.重點介紹如何通過GPU編程來實現高性能的并行計算3.本書為讀者供習題,并以“習題提示”的方式給出解題思路4.異步社區為讀者提供配套代碼

GPU編程實戰 基于Python和CUDA 內容簡介

本書旨在引導讀者基于Python與CUDA的GPU編程開發高性能的Python應用程序。全書介紹了為什么要學GPU編程、搭建GPU編程環境、PyCUDA基礎, CUDA代碼的調試與性能分析、通過Scikit-CUDA模塊使用CUDA庫、實現深度神經網絡、CUDA性能優化等內容。學完上述內容, 讀者應能從頭開始開發基于GPU的深度神經網絡, 甚至能夠解決與數據科學和GPU編程高性能計算相關的問題。

GPU編程實戰 基于Python和CUDA 目錄

第 1章 為什么要學習GPU編程 1
1.1 技術要求 2
1.2 并行化與阿姆達爾定律 2
1.2.1 使用阿姆達爾定律 3
1.2.2 Mandelbrot集 5
1.3 對代碼進行性能分析 7
1.4 小結 9
1.5 習題 10

第 2章 搭建GPU編程環境 11
2.1 技術要求 12
2.2 確保擁有合適的硬件 12
2.2.1 檢查硬件(Linux系統) 13
2.2.2 檢查硬件(Windows系統) 14
2.3 安裝GPU驅動程序 15
2.3.1 安裝GPU驅動程序(Linux系統) 16
2.3.2 安裝GPU驅動程序(Windows系統) 17
2.4 搭建C++編程環境 18
2.4.1 設置GCC、Eclipse IDE和圖形處理庫(Linux系統) 18
2.4.2 設置Visual Studio(Windows系統) 18
2.4.3 安裝CUDA Toolkit 20
2.5 為GPU編程設置Python環境 21
2.5.1 安裝PyCUDA(Linux系統) 22
2.5.2 創建環境啟動腳本(Windows系統) 22
2.5.3 安裝PyCUDA(Windows系統) 23
2.5.4 測試PyCUDA 23
2.6 小結 24
2.7 習題 25

第3章 PyCUDA入門 26
3.1 技術要求 26
3.2 查詢GPU 27
3.3 使用PyCUDA的gpuarray類 31
3.3.1 使用gpuarray在GPU之間傳輸數據 31
3.3.2 使用gpuarray進行基本的逐元素算術運算 32
3.4 使用PyCUDA的ElementwiseKernel執行逐元素運算 37
3.4.1 重溫Mandelbrot集 40
3.4.2 函數式編程簡介 44
3.4.3 并行化的掃描內核函數和規約內核函數簡介 45
3.5 小結 47
3.6 習題 47

第4章 內核函數、線程、線程塊與網格 49
4.1 技術要求 50
4.2 內核函數 50
4.3 線程、線程塊與網格 53
4.4 線程同步與線程通信 60
4.4.1 使用設備函數__syncthreads 60
4.4.2 使用共享內存 63
4.5 并行前綴算法 65
4.5.1 樸素并行前綴算法 66
4.5.2 包含型并行前綴算法與獨占型并行前綴算法 69
4.5.3 工作高效型并行前綴算法 69
4.5.4 工作高效型并行前綴算法的實現 71
4.6 小結 74
4.7 習題 74

第5章 流、事件、上下文與并發性 76
5.1 技術要求 77
5.2 CUDA設備同步 77
5.2.1 使用PyCUDA流類 78
5.2.2 通過CUDA流實現并發版本的LIFE 82
5.3 事件 85
5.4 上下文 89
5.4.1 同步當前上下文 90
5.4.2 手動創建上下文 91
5.4.3 主機端多進程與多線程技術 92
5.4.4 實現主機端并發的多上下文 93
5.5 小結 97
5.6 習題 97

第6章 CUDA代碼的調試與性能分析 99
6.1 技術要求 100
6.2 在CUDA內核函數中使用printf函數 100
6.3 CUDA C編程簡介 106
6.4 利用Nsight IDE開發和調試CUDA C代碼 113
6.4.1 在Windows平臺上的Visual Studio中使用Nsight 113
6.4.2 在Linux平臺中使用Nsight和Eclipse 117
6.4.3 借助Nsight理解CUDA的線程束鎖步特性 120
6.5 使用NVIDIA性能分析工具——nvprof與Visual Profiler 122
6.6 小結 124
6.7 習題 125

第7章 通過Scikit-CUDA模塊使用CUDA庫 126
7.1 技術要求 127
7.2 安裝Scikit-CUDA 127
7.3 利用cuBLAS庫處理基本線性代數運算 128
7.3.1 利用cuBLAS庫處理第 1級AXPY運算 128
7.3.2 其他第 1級cuBLAS函數 130
7.3.3 利用cuBLAS庫處理第 2級GEMV運算 131
7.3.4 利用cuBLAS中的第3級GEMM操作測量GPU性能 133
7.4 利用cuFFT庫進行快速傅里葉變換 136
7.4.1 一維快速傅里葉變換示例 137
7.4.2 使用FFT進行卷積操作 138
7.4.3 利用cuFFT進行二維卷積 139
7.5 通過Scikit-CUDA使用cuSolver 144
7.5.1 奇異值分解 144
7.5.2 奇異值分解在主成分分析中的應用 146
7.6 小結 147
7.7 習題 148

第8章 CUDA設備函數庫與Thrust庫 149
8.1 技術要求 150
8.2 cuRAND設備函數庫 150
8.3 CUDA Math API 155
8.3.1 定積分概述 155
8.3.2 用蒙特卡羅方法計算定積分 156
8.3.3 編寫測試用例 162
8.4 CUDA Thrust庫 164
8.5 小結 168
8.6 習題 169

第9章 實現深度神經網絡 170
9.1 技術要求 170
9.2 人工神經元與神經網絡 171
9.3 softmax層的實現 177
9.4 交叉熵損失函數的實現 179
9.5 序貫網絡的實現 180
9.5.1 推理方法的實現 182
9.5.2 梯度下降法 184
9.5.3 數據的規范化和歸一化 189
9.6 Iris數據集 190
9.7 小結 192
9.8 習題 193

第 10章 應用編譯好的GPU代碼 194
10.1 通過Ctypes模塊啟動編譯好的 代碼 194
10.2 編譯并運行純PTX代碼 201
10.3 為CUDA Driver API編寫 包裝器 203
10.4 小結 210
10.5 習題 211

第 11章 CUDA性能優化 212
11.1 動態并行性 212
11.2 向量化數據類型與 內存訪問 217
11.3 線程安全的原子操作 218
11.4 線程束洗牌 220
11.5 內聯PTX匯編 223
11.6 經過優化的數組求和 函數 227
11.7 小結 231
11.8 習題 231

第 12章 未來展望 233
12.1 深入了解CUDA和GPGPU 編程技術 234
12.1.1 多GPU系統 234
12.1.2 集群計算和消息 傳遞接口 234
12.1.3 OpenCL和 PyOpenCLCUDA 234
12.2 圖形領域 235
12.2.1 OpenGL 235
12.2.2 DirectX 12 235
12.2.3 Vulkan 236
12.3 機器學習與計算機視覺 236
12.3.1 基礎知識 236
12.3.2 cuDNN 236
12.3.3 Tensorflow與Keras 237
12.3.4 Chainer 237
12.3.5 OpenCV 237
12.4 區塊鏈技術 237
12.5 小結 238
12.6 習題 238

習題提示 239
第 1章 為什么要學習GPU編程 239
第 2章 搭建GPU編程環境 239
第3章 PyCUDA入門 240
第4章 內核函數、線程、線程塊與網格 240
第5章 流、事件、上下文與并發性 241
第6章 CUDA代碼的調試與性能分析 241
第7章 通過Scikit-CUDA模塊使用CUDA庫 242
第8章 CUDA設備函數庫與Thrust庫 242
第9章 實現深度神經網絡 243
第 10章 應用編譯好的GPU代碼 243
第 11章 CUDA性能優化 244
第 12章 未來展望 244
展開全部

GPU編程實戰 基于Python和CUDA 作者簡介

Brian Tuomanen 博士自2014年以來,一直從事CUDA 和GPU 編程方面的工作。他在美國西雅圖華盛頓大學(University of Washington)獲得了電氣工程專業的學士學位,在攻讀數學專業的碩士學位之前,從事過軟件工程方面的工作。后來,他在哥倫比亞的密蘇里大學攻讀數學博士學位,在那里與 GPU 編程"邂逅"——GPU編程當時主要用于研究科學問題。Tuomanen 博十曾經在美國陸軍研究實驗室以GPU編程為題發表演講,后來在美國馬里蘭州的一家初創公司負責GPU集成和開發方面的工作。目前,他在西雅圖擔任微軟的機器學習專家(Azure CSI)。

商品評論(1條)
  • 主題:書很好很滿意

    書的品相很好。 書的內容再看看,希望能把cuda講得通俗易懂

    2023/10/20 20:20:00
    讀者:ztw***(購買過本書)
書友推薦
本類暢銷
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 润滑脂-高温润滑脂-轴承润滑脂-食品级润滑油-索科润滑油脂厂家 | 雄松华章(广州华章MBA)官网-专注MBA/MPA/MPAcc/MEM辅导培训 | 通风气楼_通风天窗_屋顶风机-山东美创通风设备有限公司 | 昆山PCB加工_SMT贴片_PCB抄板_线路板焊接加工-昆山腾宸电子科技有限公司 | 压砖机_电动螺旋压力机_粉末成型压力机_郑州华隆机械tel_0371-60121717 | 洗砂机械-球磨制砂机-洗沙制砂机械设备_青州冠诚重工机械有限公司 | 氢氧化钾厂家直销批发-济南金昊化工有限公司 | 都江堰招聘网-都江堰人才网 都江堰人事人才网 都江堰人才招聘网 邢台人才网_邢台招聘网_邢台123招聘【智达人才网】 | 四川实木门_成都实木门 - 蓬溪聚成门业有限公司 | 针焰试验仪,灼热丝试验仪,漏电起痕试验仪,水平垂直燃烧试验仪 - 苏州亚诺天下仪器有限公司 | 丙烷/液氧/液氮气化器,丙烷/液氧/液氮汽化器-无锡舍勒能源科技有限公司 | 全温恒温摇床-水浴气浴恒温摇床-光照恒温培养摇床-常州金坛精达仪器制造有限公司 | 净化板-洁净板-净化板价格-净化板生产厂家-山东鸿星新材料科技股份有限公司 | 致胜管家软件服务【在线免费体验】| 北京工业设计公司-产品外观设计-产品设计公司-千策良品工业设计 北京翻译公司-专业合同翻译-医学标书翻译收费标准-慕迪灵 | 烟雾净化器-滤筒除尘器-防爆除尘器-除尘器厂家-东莞执信环保科技有限公司 | 洁净棚-洁净工作棚-无菌室-净化工程公司_北京卫护科技有限公司 | 山东信蓝建设有限公司官网 | 杭州代理记账多少钱-注册公司代办-公司注销流程及费用-杭州福道财务管理咨询有限公司 | 哈尔滨京科脑康神经内科医院-哈尔滨治疗头痛医院-哈尔滨治疗癫痫康复医院 | 变压器配件,变压器吸湿器,武强县吉口变压器配件有限公司 | 上海物流公司,上海货运公司,上海物流专线-优骐物流公司 | 不锈钢丸厂家,铝丸,铸钢丸-淄博智源铸造材料有限公司 | 小型高低温循环试验箱-可程式高低温湿热交变试验箱-东莞市拓德环境测试设备有限公司 | 浙江寺庙设计-杭州寺院设计-宁波寺庙规划_汉匠 | 扬子叉车厂家_升降平台_电动搬运车|堆高车-扬子仓储叉车官网 | 上海办公室装修公司_办公室设计_直营办公装修-羚志悦装 | 光泽度计_测量显微镜_苏州压力仪_苏州扭力板手维修-苏州日升精密仪器有限公司 | 818手游网_提供当下热门APP手游_最新手机游戏下载 | 广州网站建设_小程序开发_番禺网站建设_佛山网站建设_粤联网络 | 电脑刺绣_绣花厂家_绣花章仔_织唛厂家-[源欣刺绣]潮牌刺绣打版定制绣花加工厂家 | 奥运星-汽车性能网评-提供个性化汽车资讯 | 厚壁钢管-厚壁无缝钢管-小口径厚壁钢管-大口径厚壁钢管 - 聊城宽达钢管有限公司 | 防火卷帘门价格-聊城一维工贸特级防火卷帘门厂家▲ | 派财经_聚焦数字经济内容服务平台 | 南京精锋制刀有限公司-纵剪机刀片_滚剪机刀片_合金刀片厂家 | 品牌广告服务平台,好排名,好流量,好生意。 | 防水接头-电缆防水接头-金属-电缆密封接头-不锈钢电缆接头 | 首页-浙江橙树网络技术有限公司 石磨面粉机|石磨面粉机械|石磨面粉机组|石磨面粉成套设备-河南成立粮油机械有限公司 | Magnescale探规,Magnescale磁栅尺,Magnescale传感器,Magnescale测厚仪,Mitutoyo光栅尺,笔式位移传感器-苏州连达精密量仪有限公司 | 海外仓系统|国际货代系统|退货换标系统|WMS仓储系统|海豚云 |