中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >>
大規模并行處理器程序設計(原書第4版)

包郵 大規模并行處理器程序設計(原書第4版)

出版社:機械工業出版社出版時間:2025-03-01
開本: 16開 頁數: 356
中 圖 價:¥82.1(6.9折) 定價  ¥119.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

大規模并行處理器程序設計(原書第4版) 版權信息

  • ISBN:9787111772767
  • 條形碼:9787111772767 ; 978-7-111-77276-7
  • 裝幀:平裝-膠訂
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>>

大規模并行處理器程序設計(原書第4版) 本書特色

第4版重要更新:·增加關于CUDA的新內容,包括較新的庫,如CUDNN。·新增關于常用并行模式(模板、歸約、排序)的章節,并對之前的章節(卷積、直方圖、稀疏矩陣、圖遍歷、深度學習)進行了全面更新。·新增一章專門討論GPU架構,包含Ampere等新的架構示例。·優化關于問題分解策略和性能方面的討論,增加新的優化檢查清單。

大規模并行處理器程序設計(原書第4版) 內容簡介

本書內容簡潔、直觀、實用,強調計算思維能力和并行編程技巧。本書主要分為四個部分:第 一部分介紹異構并行計算編程的基礎概念,包括數據并行化、GPU架構、CUDA編程及程序性能優化方法等內容;第二部分介紹并行模式,包括卷積、模板、并行直方圖、歸約、前綴和、歸并等內容;第三部分介紹高級模式及應用,包括排序、稀疏矩陣計算、圖遍歷、深度學習、迭代式磁共振成像重建、靜電勢能圖和計算思維等內容;第四部分介紹高級編程實踐,包括異構計算集群編程、CUDA動態并行化等內容。本書不僅適合高等院校計算機相關專業的學生學習,也適合并行計算領域的技術人員參考。

大規模并行處理器程序設計(原書第4版)大規模并行處理器程序設計(原書第4版) 前言

前  言
Programming Massively Parallel Processors: A Hands-on Approach, Fourth Edition

我們非常自豪地向你介紹本書。
融合多核CPU和多線程GPU的大眾市場計算系統已經將萬億級別的計算能力引入筆記本電腦中,將億億級別的計算能力引入計算集群中。在如此強大的計算動能下,我們正處于科學、工程、醫學以及商業領域廣泛應用計算實驗的黎明。我們也親歷了GPU計算在金融、電子商務、石油與天然氣、制造等關鍵產業垂直市場的廣泛滲透。通過具有前所未有的規模、精確度、安全性、可控性與可視性的計算實驗,這些領域的突破將得以實現。本書為這一愿景提供了關鍵要素,即將并行編程教授給數百萬研究生和本科生,使得計算思維和并行編程技能能夠與微積分技能一樣廣泛普及。

大規模并行處理器程序設計(原書第4版) 目錄

目  錄
Programming Massively Parallel Processors: A Hands-on Approach, Fourth Edition
譯者序
推薦序
前言
致謝
第1章 引言 1
1.1 異構并行計算 2
1.2 為什么需要速度與并行性 5
1.3 加快實際應用的速度 6
1.4 并行編程中的挑戰 7
1.5 相關的并行編程接口 8
1.6 本書的總體目標 9
1.7 本書的章節安排 10
參考文獻 12
**部分 基本概念
第2章 異構數據并行計算 14
2.1 數據并行性 14
2.2 CUDA C程序結構 16
2.3 向量加法核 17
2.4 設備全局存儲和數據傳輸 19
2.5 核函數和線程 22
2.6 調用核函數 25
2.7 編譯 27
2.8 總結 27
2.8.1 函數聲明 27
2.8.2 內核調用和網格啟動 27
2.8.3 內置(預定義)變量 28
2.8.4 運行時應用程序編程接口 28
練習 28
參考文獻 30
第3章 多維網格和數據 31
3.1 多維網格組織 31
3.2 將線程映射到多維數據 33
3.3 圖像模糊:更復雜的內核 38
3.4 矩陣乘法 41
3.5 總結 44
練習 44
第4章 計算架構和調度 46
4.1 現代GPU架構 46
4.2 塊調度 47
4.3 同步和透明可擴展性 47
4.4 線程束和SIMD硬件 49
4.5 控制發散 53
4.6 線程束調度和延遲容忍 55
4.7 資源劃分和占用率 56
4.8 查詢設備屬性 58
4.9 總結 60
練習 60
參考文獻 61
第5章 內存架構和數據局部性 62
5.1 內存訪問效率的重要性 62
5.2 CUDA內存類型 64
5.3 利用平鋪減少內存流量 68
5.4 平鋪的矩陣乘法內核 70
5.5 邊界檢查 74
5.6 內存使用對占用率的影響 76
5.7 總結 78
練習 78
第6章 性能方面的考慮 81
6.1 內存合并 81
6.2 隱藏內存延遲 87
6.3 線程粗化 91
6.4 優化清單 93
6.5 了解計算瓶頸 96
6.6 總結 96
練習 96
參考文獻 97
第二部分 并行模式
第7章 卷積:常量內存和緩存 100
7.1 背景 100
7.2 并行卷積:一種基本算法 103
7.3 常量內存和緩存:概念與實例 105
7.4 邊緣單元平鋪卷積 108
7.5 使用邊緣單元緩存的平鋪卷積 111
7.6 總結 113
練習 113
第8章 模板 115
8.1 背景 115
8.2 并行模板:基本算法 118
8.3 用于模板掃描的共享內存平鋪 119
8.4 線程粗化 121
8.5 寄存器平鋪 123
8.6 總結 125
練習 125
第9章 并行直方圖:原子操作和
私有化 126
9.1 背景 126
9.2 原子操作與基本直方圖內核 128
9.3 原子操作的延遲和吞吐量 131
9.4 私有化 132
9.5 粗化 134
9.6 聚合 137
9.7 總結 138
練習 138
參考文獻 139
第10章 歸約和*小化發散 140
10.1 背景 140
10.2 歸約樹 141
10.3 一個簡單的歸約內核 143
10.4 *小化控制發散 145
10.5 *小化內存發散 148
10.6 *小化全局內存訪問 149
10.7 對任意輸入長度進行分層歸約 150
10.8 利用線程粗化減少開銷 152
10.9 總結 154
練習 154
第11章 前綴和(掃描):并行算法的工作效率 156
11.1 背景 156
11.2 基于Kogge-Stone算法的并行
掃描 158
11.3 關于速度與工作效率的考慮 162
11.4 基于Brent-Kung算法的并行
掃描 163
11.5 利用粗化提高工作效率 167
11.6 任意長度輸入的分段并行掃描 168
11.7 利用單次掃描提高內存訪問
效率 171
11.8 總結 172
練習 173
參考文獻 173
第12章 歸并:動態輸入數據
識別 175
12.1 背景 175
12.2 串行歸并算法 176
12.3 并行化方法 177
12.4 共秩函數的實現 178
12.5 基本并行歸并內核 182
12.6 用于改進內存合并的平鋪歸并
內核 183
12.7 循環緩沖區歸并內核 187
12.8 用于歸并的線程粗化 192
12.9 總結 192
練習 193
參考文獻 193
第三部分 高級模式及應用
第13章 排序 196
13.1 背景 196
13.2 基數排序 197
13.3 并行基數排序 198
13.4 內存合并優化 200
13.5 基值的選擇 202
13.6 利用線程粗化改善合并 204
13.7 并行歸并排序 205
13.8 其他并行排序方法 205
13.9 總結 206
練習 207
參考文獻 207
第14章 稀疏矩陣計算 208
14.1 背景 208
14.2 具有COO格式的簡單SpMV
內核 209
14.3 利用CSR格式分組非零行 211
展開全部

大規模并行處理器程序設計(原書第4版) 作者簡介

胡文美(Wen-mei W. Hwu)
NVIDIA公司杰出研究科學家兼高級研究總監。伊利諾伊大學厄巴納-香檳分校榮休教授,并行計算研究中心首席科學家。他在編譯器設計、計算機體系結構、微體系結構和并行計算方面做出了卓越貢獻,是IEEE Fellow、ACM Fellow,榮獲了包括ACM-IEEE CS Eckert-Mauchly獎、ACM Grace Murray Hopper獎、ACM SIGARCH Maurice Wilkes獎在內的眾多獎項。他擁有加州大學伯克利分校計算機科學博士學位。

大衛·B. 柯克(David B. Kirk)
美國國家工程院院士,NVIDIA Fellow,曾任NVIDIA公司首席科學家。2002年,他榮獲ACM SIGGRAPH計算機圖形學成就獎,以表彰其在把高性能計算機圖形系統推向大眾市場方面做出的杰出貢獻。他擁有加州理工學院計算機科學博士學位。
胡文美(Wen-mei W. Hwu)
NVIDIA公司杰出研究科學家兼高級研究總監。伊利諾伊大學厄巴納-香檳分校榮休教授,并行計算研究中心首席科學家。他在編譯器設計、計算機體系結構、微體系結構和并行計算方面做出了卓越貢獻,是IEEE Fellow、ACM Fellow,榮獲了包括ACM-IEEE CS Eckert-Mauchly獎、ACM Grace Murray Hopper獎、ACM SIGARCH Maurice Wilkes獎在內的眾多獎項。他擁有加州大學伯克利分校計算機科學博士學位。

大衛·B. 柯克(David B. Kirk)
美國國家工程院院士,NVIDIA Fellow,曾任NVIDIA公司首席科學家。2002年,他榮獲ACM SIGGRAPH計算機圖形學成就獎,以表彰其在把高性能計算機圖形系統推向大眾市場方面做出的杰出貢獻。他擁有加州理工學院計算機科學博士學位。

伊扎特·埃爾·哈吉(Izzat El Hajj)
貝魯特美國大學計算機科學系助理教授。他的研究方向是針對新興并行處理器和內存技術的應用加速和編程支持,特別是GPU和存算一體。他擁有伊利諾伊大學厄巴納-香檳分校電氣與計算機工程博士學位。

商品評論(0條)
暫無評論……
書友推薦
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 篮球地板厂家_舞台木地板品牌_体育运动地板厂家_凯洁地板 | 塑料薄膜_PP薄膜_聚乙烯薄膜-常州市鑫美新材料包装厂 | 大米加工设备|大米加工机械|碾米成套设备|大米加工成套设备-河南成立粮油机械有限公司 | 小型高低温循环试验箱-可程式高低温湿热交变试验箱-东莞市拓德环境测试设备有限公司 | PE一体化污水处理设备_地埋式生活污水净化槽定制厂家-岩康塑业 | 浙江华锤电器有限公司_地磅称重设备_防作弊地磅_浙江地磅售后维修_无人值守扫码过磅系统_浙江源头地磅厂家_浙江工厂直营地磅 | 广州番禺搬家公司_天河黄埔搬家公司_企业工厂搬迁_日式搬家_广州搬家公司_厚道搬迁搬家公司 | 工业胀紧套_万向节联轴器_链条-规格齐全-型号选购-非标订做-厂家批发价格-上海乙谛精密机械有限公司 | 电缆桥架生产厂家_槽式/梯式_热镀锌线槽_广东东莞雷正电气 | 电动车头盔厂家_赠品头盔_安全帽批发_山东摩托车头盔—临沂承福头盔 | 【星耀裂变】_企微SCRM_任务宝_视频号分销裂变_企业微信裂变增长_私域流量_裂变营销 | ICP备案查询_APP备案查询_小程序备案查询 - 备案巴巴 | 安驭邦官网-双向万能直角铣头,加工中心侧铣头,角度头[厂家直销] 闸阀_截止阀_止回阀「生产厂家」-上海卡比阀门有限公司 | 北京京云律师事务所 | SRRC认证|CCC认证|CTA申请_IMEI|MAC地址注册-英利检测 | 低温等离子清洗机(双气路进口)-嘉润万丰 | 食品无尘净化车间,食品罐装净化车间,净化车间配套风淋室-青岛旭恒洁净技术有限公司 | 比士亚-专业恒温恒湿酒窖,酒柜,雪茄柜的设计定制 | 高压直流电源_特种变压器_变压器铁芯-希恩变压器定制厂家 | 高低温老化试验机-步入式/低温恒温恒湿试验机-百科 | 深圳法律咨询【24小时在线】深圳律师咨询免费 | 橡胶粉碎机_橡胶磨粉机_轮胎粉碎机_轮胎磨粉机-河南鼎聚重工机械制造有限公司 | 安平县鑫川金属丝网制品有限公司,防风抑尘网,单峰防风抑尘,不锈钢防风抑尘网,铝板防风抑尘网,镀铝锌防风抑尘网 | 成都APP开发-成都App定制-成都app开发公司-【未来久】 | 建筑消防设施检测系统检测箱-电梯**检测仪器箱-北京宇成伟业科技有限责任公司 | 土壤水分自动监测站-SM150便携式土壤水分仪-铭奥仪器 | 工业PH计|工业ph酸度计|在线PH计价格-合肥卓尔仪器仪表有限公司 济南画室培训-美术高考培训-山东艺霖艺术培训画室 | 水平筛厂家-三轴椭圆水平振动筛-泥沙震动筛设备_山东奥凯诺矿机 包装设计公司,产品包装设计|包装制作,包装盒定制厂家-汇包装【官方网站】 | 德国EA可编程直流电源_电子负载,中国台湾固纬直流电源_交流电源-苏州展文电子科技有限公司 | 烟雾净化器-滤筒除尘器-防爆除尘器-除尘器厂家-东莞执信环保科技有限公司 | 长沙网站建设制作「网站优化推广」-网页设计公司-速马科技官网 | 数控走心机-走心机价格-双主轴走心机-宝宇百科 | 洛阳装修公司-洛阳整装一站式品牌-福尚云宅装饰 | 123悬赏网_发布悬赏任务_广告任务平台 | PC构件-PC预制构件-构件设计-建筑预制构件-PC构件厂-锦萧新材料科技(浙江)股份有限公司 | 纯化水设备-纯水设备-超纯水设备-[大鹏水处理]纯水设备一站式服务商-东莞市大鹏水处理科技有限公司 | 根系分析仪,大米外观品质检测仪,考种仪,藻类鉴定计数仪,叶面积仪,菌落计数仪,抑菌圈测量仪,抗生素效价测定仪,植物表型仪,冠层分析仪-杭州万深检测仪器网 | 翰墨AI智能写作助手官网_人工智能问答在线AI写作免费一键生成 | 乐泰胶水_loctite_乐泰胶_汉高乐泰授权(中国)总代理-鑫华良供应链 | 智慧食堂_食堂管理系统_食堂订餐_食堂消费系统—客易捷 | 东莞市踏板石餐饮管理有限公司_正宗桂林米粉_正宗桂林米粉加盟_桂林米粉加盟费-东莞市棒子桂林米粉 |