中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >>
高性能計算技術叢書基于CUDA的GPU并行程序開發指南

包郵 高性能計算技術叢書基于CUDA的GPU并行程序開發指南

出版社:機械工業出版社出版時間:2018-05-01
開本: 16開 頁數: 444
中 圖 價:¥123.5(6.9折) 定價  ¥179.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>
買過本商品的人還買了

高性能計算技術叢書基于CUDA的GPU并行程序開發指南 版權信息

  • ISBN:9787111630616
  • 條形碼:9787111630616 ; 978-7-111-63061-6
  • 裝幀:一般膠版紙
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>>

高性能計算技術叢書基于CUDA的GPU并行程序開發指南 本書特色

作者結合多年CUDA教學和工程實踐經驗精心撰寫。內容豐富詳實、通俗易懂,是學習CUDA編程的*佳選擇。

高性能計算技術叢書基于CUDA的GPU并行程序開發指南 內容簡介

近10年來,隨著大數據、深度學習等相關領域的發展,對計算能力的需求呈幾何級數增長。與此同時,大規模集成電路的發展卻受到功耗、散熱、晶體管尺寸等客觀因素的,難以繼續維持摩爾定律。因此,人們逐漸把目光轉向了并行系統。GPU自誕生之日起就是為計算機的圖形圖像渲染等大規模并行處理任務而服務的,因而越來越受到研究界和企業界的關注。隨著CUDA等計算架構模型的出現,這一趨勢更加明顯。CUDA(Compute Unified Device Architecture,統一計算設備架構)是Nvidia(英偉達)提出的并行計算架構,它可以結合CPU和GPU的優點,處理大規模的計算密集型任務。同時,它采用了基于C語言風格的語法,又將CPU端和GPU端的開發有效地集成到了同一環境中,對于大多數C程序員來說,使用十分方便,因而一經推出就迅速占領了GPU開發環境的市場。然而,會寫CUDA程序與會寫好的CUDA程序相差甚遠!阻礙CUDA程序獲得高性能的原因有很多。首先,GPU屬于單指令多數據類型的并行計算,因而任務切分方式很好關鍵,既要充分挖掘線程級的并行性,也要充分利用流來實現任務級的并行。其次,GPU的存儲類型和訪問模式比CPU的要豐富得多,一個成功的CUDA程序要能充分利用不同類型的存儲。再次,Nvidia GPU的架構還處于高速發展期,新一代GPU所推出的新功能也能夠有效地提升計算效率。很后,萬丈高樓平地起并不是CUDA開發的很好方式,Nvidia和一些第三方機構都開發了很多基于CUDA的支撐庫,利用好這些第三方庫可以讓你的開發過程事半功倍。Tolga Soyata結合他10多年的CUDA教學經驗以及與Nvidia多年合作的經歷精心撰寫了本書,針對上述問題進行了詳細而生動的闡述。本書很獨特的地方是它在部分中通過CPU多線程解釋并行計算,使沒有太多并行計算基礎的讀者也能毫無阻礙地進入CUDA天地。第二部分重點介紹了基于CUDA的GPU大規模并行程序的開發與實現。與現有的同類書籍相比,本書的特點是在多個Nvidia GPU平臺(Fermi、Kepler、Maxwell和Pascal)上并行化,并進行性能分析,幫助讀者理解GPU架構對程序性能的影響。第三部分介紹了一些重要的CUDA庫,比如cuBLAS、cuFFT、NPP和Thrust(2章);OpenCL編程語言(3章);使用其他編程語言和API庫進行GPU編程,包括Python、Metal、Swift、OpenGL、OpenGL ES、OpenCV和微軟HLSL(4章);當下流行的深度學習庫cuDNN(5章)。本書通過生動的類比、大量的代碼和詳細的解釋向讀者循序漸進地介紹了基于CUDA編程開發的GPU并行計算方法,內容豐富翔實,適合所有具備基本的C語言知識的程序員閱讀,也適合作為GPU并行計算相關課程的教材。

高性能計算技術叢書基于CUDA的GPU并行程序開發指南 目錄

譯者序
前言
關于作者
**部分 理解CPU的并行性
第1章 CPU并行編程概述 2
1.1 并行編程的演化 2
1.2 核心越多,并行性越高 3
1.3 核心與線程 4
1.3.1 并行化更多的是線程還是核心 5
1.3.2 核心資源共享的影響 6
1.3.3 內存資源共享的影響 6
1.4 **個串行程序 7
1.4.1  理解數據傳輸速度 8
1.4.2 imflip.c中的main( )函數 9
1.4.3 垂直翻轉行:FlipImageV( ) 10
1.4.4 水平翻轉列:FlipImageH( ) 11
1.5 程序的編輯、編譯、運行 12
1.5.1 選擇編輯器和編譯器 12
1.5.2 在Windows 7、8、10平臺上開發 12
1.5.3 在Mac平臺上開發 14
1.5.4 在Unix平臺上開發 14
1.6 Unix速成 15
1.6.1 與目錄相關的Unix命令 15
1.6.2 與文件相關的Unix命令 16
1.7 調試程序 19
1.7.1 gdb 19
1.7.2 古典調試方法 20
1.7.3 valgrind 22
1.8 **個串行程序的性能 22
1.8.1 可以估計執行時間嗎 23
1.8.2 代碼執行時OS在做什么 23
1.8.3 如何并行化 24
1.8.4 關于資源的思考 25
第2章 開發**個CPU并行程序 26
2.1 **個并行程序 26
2.1.1 imflipP.c中的main( )函數 27
2.1.2 運行時間 28
2.1.3 imflipP.c中main( )函數代碼的劃分 28
2.1.4 線程初始化 30
2.1.5 創建線程 31
2.1.6  線程啟動/執行 32
2.1.7 線程終止(合并) 33
2.1.8 線程任務和數據劃分 34
2.2 位圖文件 35
2.2.1 BMP是一種無損/不壓縮的文件格式 35
2.2.2 BMP圖像文件格式 36
2.2.3 頭文件ImageStuff.h 37
2.2.4 ImageStuff.c中的圖像操作函數 38
2.3 執行線程任務 40
2.3.1 啟動線程 41
2.3.2 多線程垂直翻轉函數MTFlipV( ) 43
2.3.3 FlipImageV( )和MTFlipV( )的比較 46
2.3.4 多線程水平翻轉函數MTFlipH(?) 47
2.4 多線程代碼的測試/計時 49
第3章 改進**個CPU并行程序 51
3.1 程序員對性能的影響 51
3.2 CPU對性能的影響 52
3.2.1 按序核心與亂序核心 53
3.2.2 瘦線程與胖線程 55
3.3 imf?lipP的性能 55
3.4 操作系統對性能的影響 56
3.4.1 創建線程 57
3.4.2 線程啟動和執行 57
3.4.3 線程狀態 58
3.4.4 將軟件線程映射到硬件線程 59
3.4.5  程序性能與啟動的線程 60
3.5 改進imf?lipP 61
3.5.1  分析MTFlipH( )中的內存訪問模式 62
3.5.2  MTFlipH( )的多線程內存訪問 63
3.5.3  DRAM訪問的規則 64
3.6 imf?lipPM:遵循DRAM的規則 65
3.6.1 imflipP的混亂內存訪問模式 65
3.6.2 改進imflipP的內存訪問模式 65
3.6.3 MTFlipHM( ):內存友好的MTFlipH( ) 66
3.6.4 MTFlipVM( ):內存友好的MTFlipV( ) 69
3.7 imflipPM.C的性能 69
3.7.1 imflipP.c和imflipPM.c的性能比較 70
3.7.2 速度提升:MTFlipV( )與MTFlipVM( ) 71
3.7.3 速度提升:MTFlipH( )與MTFlipHM( ) 71
3.7.4 理解加速:MTFlipH( )與MTFlipHM( ) 71
3.8 進程內存映像 72
3.9 英特爾MIC架構:Xeon Phi 74
3.10 GPU是怎樣的 75
3.11 本章小結 76
第4章 理解核心和內存 77
4.1 曾經的英特爾 77
4.2 CPU和內存制造商 78
4.3 動態存儲器與靜態存儲器 79
4.3.1 靜態隨機存取存儲器(SRAM) 79
4.3.2  動態隨機存取存儲器(DRAM) 79
4.3.3 DRAM接口標準 79
4.3.4 DRAM對程序性能的影響 80
4.3.5 SRAM對程序性能的影響 81
4.4 圖像旋轉程序:imrotate.c 81
4.4.1 imrotate.c的說明 82
4.4.2 imrotate.c:參數限制和簡化 82
4.4.3 imrotate.c:實現原理 83
4.5 imrotate的性能 87
4.5.1 線程效率的定性分析 87
4.5.2 定量分析:定義線程效率 87
4.6 計算機的體系結構 89
4.6.1 核心、L1$和L2$ 89
4.6.2 核心內部資源 90
4.6.3  共享L3高速緩存(L3 $) 91
4.6.4 內存控制器 92
4.6.5 主存 92
4.6.6 隊列、非核心和I/O 93
4.7 imrotateMC:讓imrotate更高效 94
4.7.1 Rotate2( ):平方根和浮點除法有多差 96
4.7.2 Rotate3( )和Rotate4( ):sin( )和cos( )有多差 97
4.7.3 Rotate5( ):整數除法/乘法有多差 98
4.7.4 Rotate6( ):合并計算 100
4.7.5 Rotate7( ):合并更多計算 100
4.7.6 imrotateMC的總體性能 101
4.8 本章小結 103
第5章 線程管理和同步 104
5.1 邊緣檢測程序:imedge.c 104
5.1.1 imedge.c的說明 105
5.1.2 imedge.c:參數限制和簡化 106
5.1.3 imedge.c:實現原理 106
5.2 imedge.c:實現 108
5.2.1 初始化和時間戳 109
5.2.2 不同圖像表示的初始化函數 110
5.2.3 啟動和終止線程 111
5.2.4 高斯濾波 112
5.2.5 Sobel 113
5.2.6 閾值過濾 114
5.3 imedge的性能 115
5.4 imedgeMC:讓imedge更高效 116
5.4.1 利用預計算降低帶寬 116
5.4.2 存儲預計算的像素值 117
5.4.3 預計算像素值 118
5.4.4 讀取圖像并預計算像素值 119
5.4.5 PrGaussianFilter 1
展開全部

高性能計算技術叢書基于CUDA的GPU并行程序開發指南 作者簡介

Tolga Soyata于1988年在伊斯坦布爾技術大學電子與通信工程系獲得學士學位,1992年在美國馬里蘭州巴爾的摩的約翰·霍普金斯大學電氣與計算機工程系(ECE)獲得碩士學位,2000年在羅切斯特大學電氣與計算機工程系獲得博士學位。2000年至2015年間,他成立了一家IT外包和復印機銷售/服務公司。在運營公司的同時,他重返學術界,在羅切斯特大學電氣與計算機工程系擔任研究員。之后,他成為助理教授,并一直擔任電氣與計算機工程系教職研究人員至2016年。在羅切斯特大學電氣與計算機工程系任職期間,他指導了三名博士研究生。其中兩人在他的指導下獲得博士學位,另一位在他2016年加入紐約州立大學奧爾巴尼分校擔任電氣與計算機工程系副教授時留在了羅切斯特大學。Soyata的教學課程包括大規模集成電路、模擬電路以及使用FPGA和GPU進行并行編程。他的研究興趣包括信息物理系統、數字健康和高性能醫療移動云計算系統等。
Tolga Soyata從2009年開始從事GPU編程的教學,當時他聯系Nvidia將羅切斯特大學認證為CUDA教學中心(CTC)。在Nvidia將羅切斯特大學認證為教學中心后,他成為主要負責人。之后,Nvidia還將羅切斯特大學認證為CUDA研究中心(CRC),他也成為項目負責人。Tolga Soyata在羅切斯特大學擔任這些計劃的負責人直到他于2016年加入紐約州立大學奧爾巴尼分校。這些計劃后來被Nvidia命名為GPU教育中心和GPU研究中心。在羅切斯特大學期間,他講授了5年GPU編程和高級GPU項目開發課程,這些課程同時被列入電氣與計算機工程系以及計算機科學與技術系的課程體系。自2016年加入紐約州立大學奧爾巴尼分校以來,他一直在講授類似的課程。本書是他在兩所大學講授GPU課程的經驗結晶。

商品評論(0條)
暫無評論……
書友推薦
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: TPM咨询,精益生产管理,5S,6S现场管理培训_华谋咨询公司 | 无锡网站建设-做网站-建网站-网页设计制作-阿凡达建站公司 | 齿辊分级破碎机,高低压压球机,立式双动力磨粉机-郑州长城冶金设备有限公司 | 一体化污水处理设备,一体化污水设备厂家-宜兴市福源水处理设备有限公司 | 工业PH计|工业ph酸度计|在线PH计价格-合肥卓尔仪器仪表有限公司 济南画室培训-美术高考培训-山东艺霖艺术培训画室 | 阳光模拟试验箱_高低温试验箱_高低温冲击试验箱_快速温变试验箱|东莞市赛思检测设备有限公司 | 河南道路标志牌_交通路标牌_交通标志牌厂家-郑州路畅交通 | 电脑知识|软件|系统|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网 | 永嘉县奥阳陶瓷阀门有限公司 | 济南玻璃安装_济南玻璃门_济南感应门_济南玻璃隔断_济南玻璃门维修_济南镜片安装_济南肯德基门_济南高隔间-济南凯轩鹏宇玻璃有限公司 | 知企服务-企业综合服务(ZiKeys.com)-品优低价、种类齐全、过程管理透明、速度快捷高效、放心服务,知企专家! | 垃圾压缩设备_垃圾处理设备_智能移动式垃圾压缩设备--山东明莱环保设备有限公司 | 污泥烘干机-低温干化机-工业污泥烘干设备厂家-焦作市真节能环保设备科技有限公司 | 合肥花魁情感婚姻咨询中心_挽回爱情_修复婚姻_恋爱指南 | 洗瓶机厂家-酒瓶玻璃瓶冲瓶机-瓶子烘干机-封口旋盖压盖打塞机_青州惠联灌装机械 | 振动时效_振动时效仪_超声波冲击设备-济南驰奥机电设备有限公司 北京宣传片拍摄_产品宣传片拍摄_宣传片制作公司-现像传媒 | 德国BOSCH电磁阀-德国HERION电磁阀-JOUCOMATIC电磁阀|乾拓百科 | 重庆轻质隔墙板-重庆安吉升科技有限公司 | 天津试验仪器-电液伺服万能材料试验机,恒温恒湿标准养护箱,水泥恒应力压力试验机-天津鑫高伟业科技有限公司 | 湖南教师资格网-湖南教师资格证考试网| 包塑软管|金属软管|包塑金属软管-闵彬管业 | 硬度计,金相磨抛机_厂家-莱州华煜众信试验仪器有限公司 | 铝合金风口-玻璃钢轴流风机-玻璃钢屋顶风机-德州东润空调设备有限公司 | 膜结构车棚|上海膜结构车棚|上海车棚厂家|上海膜结构公司 | 高效节能电机_伺服主轴电机_铜转子电机_交流感应伺服电机_图片_型号_江苏智马科技有限公司 | 无硅导热垫片-碳纤维导热垫片-导热相变材料厂家-东莞市盛元新材料科技有限公司 | 厦门网站建设_厦门网站设计_小程序开发_网站制作公司【麦格科技】 | 等离子表面处理机-等离子表面活化机-真空等离子清洗机-深圳市东信高科自动化设备有限公司 | 铣刨料沥青破碎机-沥青再生料设备-RAP热再生混合料破碎筛分设备 -江苏锡宝重工 | 沈阳液压泵_沈阳液压阀_沈阳液压站-沈阳海德太科液压设备有限公司 | 郑州外墙清洗_郑州玻璃幕墙清洗_郑州开荒保洁-河南三恒清洗服务有限公司 | 广西资质代办_建筑资质代办_南宁资质代办理_新办、增项、升级-正明集团 | pH污水传感器电极,溶解氧电极传感器-上海科蓝仪表科技有限公司 | 招商帮-一站式网络营销服务|搜索营销推广|信息流推广|短视视频营销推广|互联网整合营销|网络推广代运营|招商帮企业招商好帮手 | 南京试剂|化学试剂|分析试剂|实验试剂|cas号查询-专业60年试剂销售企业 | 首页-恒温恒湿试验箱_恒温恒湿箱_高低温试验箱_高低温交变湿热试验箱_苏州正合 | led全彩屏-室内|学校|展厅|p3|户外|会议室|圆柱|p2.5LED显示屏-LED显示屏价格-LED互动地砖屏_蕙宇屏科技 | 网优资讯-为循环资源、大宗商品、工业服务提供资讯与行情分析的数据服务平台 | PSI渗透压仪,TPS酸度计,美国CHAI PCR仪,渗透压仪厂家_价格,微生物快速检测仪-华泰和合(北京)商贸有限公司 | 济南货架定做_仓储货架生产厂_重型货架厂_仓库货架批发_济南启力仓储设备有限公司 | 恒温恒湿箱(药品/保健品/食品/半导体/细菌)-兰贝石(北京)科技有限公司 |