中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
CUDA并行程序設計-GPU編程指南

包郵 CUDA并行程序設計-GPU編程指南

作者:ShaneCook
出版社:機械工業出版社出版時間:2014-01-01
開本: 其它 頁數: 522
中 圖 價:¥69.3(7.0折) 定價  ¥99.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>
買過本商品的人還買了

CUDA并行程序設計-GPU編程指南 版權信息

CUDA并行程序設計-GPU編程指南 本書特色

本書是cuda并行程序設計領域*全面、*詳實和*具權威性的著作之一,由cuda開發者社區技術總監親自撰寫,英偉達中國首批cuda官方認證工程師翻譯,詳實地講解了cuda并行程序設計的技術知識點(平臺、架構、硬件知識、開發工具和熱點技術)和編程方法,包含大量實用代碼示例,實踐性非常強。   全書共分為12章。第1章從宏觀上介紹流處理器演變歷史。第2章詳解gpu并行機制,深入理解串行與并行程序,以辯證地求解問題。第3章講解cuda設備及相關的硬件和體系結構,以實現*優cuda程序性能。第4章介紹cuda開發環境搭建和可用調試環境。第5章介紹與cuda編程緊密相關的核心概念——網格、線程塊與線程,并通過示例說明線程模型與性能的關系。第6章借助實例詳細講解了不同類型內存的工作機制,并指出實踐中容易出現的誤區。第7章細述多任務的cpu和gpu協同,并介紹多個cpu/gpu編程秘技。第8章介紹如何在應用程序中編寫和使用多gpu。第9章詳述cuda編程性能限制因素、分析cuda代碼的工具和技術。第10章介紹編程實踐中的庫與軟件開發工具包。第11章講解如何設計基于gpu的系統。第12章總結cuda應用中易犯錯誤以及應對建議。

CUDA并行程序設計-GPU編程指南 內容簡介

cuda開發者社區技術總監親自撰寫,英偉達中國首批cuda官方認證工程師翻譯,譯著雙馨   全面、詳實地講解了cuda并行程序設計的技術知識點和編程方法,包含大量實用代碼示例,是目前學習cuda編程*權威的著作之一

CUDA并行程序設計-GPU編程指南 目錄

致中國讀者
譯者序
前 言
第1章 超級計算簡史
1.1 簡介
1.2 馮?諾依曼計算機架構
1.3 克雷
1.4 連接機
1.5 cell處理器
1.6 多點計算
1.7 早期的gpgpu編程
1.8 單核解決方案的消亡
1.9 英偉達和cuda
1.10 gpu硬件
1.11 cuda的替代選擇
1.11.1 opencl
1.11.2 directcompute
1.11.3 cpu的替代選擇
1.11.4 編譯指令和庫
1.12 本章小結
第2章 使用gpu理解并行計算
2.1 簡介
2.2 傳統的串行代碼
2.3 串行/并行問題
2.4 并發性
2.5 并行處理的類型
2.5.1 基于任務的并行處理
2.5.2 基于數據的并行處理
2.6 弗林分類法
2.7 常用的并行模式
2.7.1 基于循環的模式
2.7.2 派生/匯集模式
2.7.3 分條/分塊
2.7.4 分而治之
2.8 本章小結
第3章 cuda硬件概述
3.1 pc架構
3.2 gpu硬件結構
3.3 cpu與gpu
3.4 gpu計算能力
3.4.1 計算能力1.0
3.4.2 計算能力1.1
3.4.3 計算能力1.2
3.4.4 計算能力1.3
3.4.5 計算能力2.0
3.4.6 計算能力2.1
第4章 cuda環境搭建
4.1 簡介
4.2 在windows下安裝軟件開發工具包
4.3 visual studio
4.3.1 工程
4.3.2 64位用戶
4.3.3 創建工程
4.4 linux
4.5 mac
4.6 安裝調試器
4.7 編譯模型
4.8 錯誤處理
4.9 本章小結
第5章 線程網格、線程塊以及線程
5.1 簡介
5.2 線程
5.2.1 問題分解
5.2.2 cpu與gpu的不同
5.2.3 任務執行模式
5.2.4 gpu線程
5.2.5 硬件初窺
5.2.6 cuda內核
5.3 線程塊
5.4 線程網格
5.4.1 跨幅與偏移
5.4.2 x與y方向的線程索引
5.5 線程束
5.5.1 分支
5.5.2 gpu的利用率
5.6 線程塊的調度
5.7 一個實例——統計直方圖
5.8 本章小結
第6章 cuda內存處理
6.1 簡介
6.2 高速緩存
6.3 寄存器的用法
6.4 共享內存
6.4.1 使用共享內存排序
6.4.2 基數排序
6.4.3 合并列表
6.4.4 并行合并
6.4.5 并行歸約
6.4.6 混合算法
6.4.7 不同gpu上的共享內存
6.4.8 共享內存小結
6.5 常量內存
6.5.1 常量內存高速緩存
6.5.2 常量內存廣播機制
6.5.3 運行時進行常量內存更新
6.6 全局內存
6.6.1 記分牌
6.6.2 全局內存排序
6.6.3 樣本排序
6.7 紋理內存
6.7.1 紋理緩存
6.7.2 基于硬件的內存獲取操作
6.7.3 使用紋理的限制
6.8 本章小結
第7章 cuda實踐之道
7.1 簡介
7.2 串行編碼與并行編碼
7.2.1 cpu與gpu的設計目標
7.2.2 cpu與gpu上的*佳算法對比
7.3 數據集處理
7.4 性能分析
7.5 一個使用aes的示例
7.5.1 算法
7.5.2 aes的串行實現
7.5.3 初始內核函數
7.5.4 內核函數性能
7.5.5 傳輸性能
7.5.6 單個執行流版本
7.5.7 如何與cpu比較
7.5.8 考慮在其他gpu上運行
7.5.9 使用多個流
7.5.10 aes總結
7.6 本章小結
第8章 多cpu和多gpu解決方案
8.1 簡介
8.2 局部性
8.3 多cpu系統
8.4 多gpu系統
8.5 多gpu算法
8.6 按需選用gpu
8.7 單節點系統
8.8 流
8.9 多節點系統
8.10 本章小結
第9章 應用程序性能優化
9.1 策略1:并行/串行在gpu/cpu上的問題分解
9.1.1 分析問題
9.1.2 時間
9.1.3 問題分解
9.1.4 依賴性
9.1.5 數據集大小
9.1.6 分辨率
9.1.7 識別瓶頸
9.1.8 cpu和gpu的任務分組
9.1.9 本節小結
9.2 策略2:內存因素
9.2.1 內存帶寬
9.2.2 限制的來源
9.2.3 內存組織
9.2.4 內存訪問以計算比率
9.2.5 循環融合和內核融合
9.2.6 共享內存和高速緩存的使用
9.2.7 本節小結
9.3 策略3:傳輸
9.3.1 鎖頁內存
9.3.2 零復制內存
9.3.3 帶寬限制
9.3.4 gpu計時
9.3.5 重疊gpu傳輸
9.3.6 本節小結
9.4 策略4:線程使用、計算和分支
9.4.1 線程內存模式
9.4.2 非活動線程
9.4.3 算術運算密度
9.4.4 一些常見的編譯器優化
9.4.5 分支
9.4.6 理解底層匯編代碼
9.4.7 寄存器的使用
9.4.8 本節小結
9.5 策略5:算法
9.5.1 排序
9.5.2 歸約
9.5.3 本節小結
9.6 策略6:資源競爭
9.6.1 識別瓶頸
9.6.2 解析瓶頸
9.6.3 本節小結
9.7 策略7:自調優應用程序
9.7.1 識別硬件
9.7.2 設備的利用
9.7.3 性能采樣
9.7.4 本節小結
9.8 本章小結
第10章 函數庫和sdk
10.1 簡介
10.2 函數庫
10.2.1 函數庫通用規范
10.2.2 npp
10.2.3 thrust
10.2.4 curand
10.2.5 cublas庫
10.3 cuda運算sdk
10.3.1 設備查詢
10.3.2 帶寬測試
10.3.3 simplep2p
10.3.4 asyncapi和cudaopenmp
10.3.5 對齊類型
10.4 基于指令的編程
10.5 編寫自己的內核
10.6 本章小結
第11章 規劃gpu硬件系統
11.1 簡介
11.2 cpu處理器
11.3 gpu設備
11.3.1 大容量內存的支持
11.3.2 ecc內存的支持
11.3.3 tesla計算集群驅動程序
11.3.4 更高雙精度數學運算
11.3.5 大內存總線帶寬
11.3.6 系統管理中斷
11.3.7 狀態指示燈
11.4 pci-e總線
11.5 geforce板卡
11.6 cpu內存
11.7 風冷
11.8 液冷
11.9 機箱與主板
11.10 大容量存儲
11.10.1 主板上的輸入/輸出接口
11.10.2 專用raid控制器
11.10.3 hdsl
11.10.4 大容量存儲需求
11.10.5 聯網
11.11 電源選擇
11.12 操作系統
11.12.1 windows
11.12.2 linux
11.13 本章小結
第12章 常見問題、原因及解決方案
12.1 簡介
12.2 cuda指令錯誤
12.2.1 cuda錯誤處理
12.2.2 內核啟動和邊界檢查
12.2.3 無效的設備操作
12.2.4 volatile限定符
12.2.5 計算能力依賴函數
12.2.6 設備函數、全局函數和主機函數
12.2.7 內核中的流
12.3 并行編程問題
12.3.1 競爭冒險
12.3.2 同步
12.3.3 原子操作
12.4 算法問題
12.4.1 對比測試
12.4.2 內存泄漏
12.4.3 耗時的內核程序
12.5 查找并避免錯誤
12.5.1 你的gpu程序有多少錯誤
12.5.2 分而治之
12.5.3 斷言和防御型編程
12.5.4 調試級別和打印
12.5.5 版本控制
12.6 為未來的gpu進行開發
12.6.1 開普勒架構
12.6.2 思考
12.7 后續學習資源
12.7.1 介紹
12.7.2 在線課程
12.7.3 教學課程
12.7.4 書籍
12.7.5 英偉達cuda資格認證
12.8 本章小結

 

展開全部

CUDA并行程序設計-GPU編程指南 作者簡介

Shane Cook CUDA開發者社區技術總監,有20余年行業經驗。當認識到異構系統以及CUDA對于已有串行和并行編程技術的革命性沖擊時,創立了CUDA開發者社區(歐洲的咨詢公司,專門幫助企業重構代碼以充分利用GPU硬件的威力)。他專注于高性能軟件開發、GPU利用、嵌入式系統,并參與了多個C語言編程標準的建設,包括廣泛應用于汽車軟件行業的汽車工業軟件MISRA Safer C。他常為德國汽車行業、國防承包行業、北電網絡以及福特汽車公司等機構或藍籌股公司提供專業咨詢服務和軟件定制開發。   譯者簡介   蘇統華 博士,英偉達中國首批CUDA官方認證工程師,主要研究領域包括大規模并行計算、模式識別、物聯網智能信息處理、智能媒體交互與計算等。2013年,其所開發的CUDA識別算法,在文檔分析和識別國際會議(ICDAR’ 2013)上獲得手寫漢字識別競賽的雙料冠軍。另外,他在手寫漢字識別領域建立了里程碑式的工作,論文他引300余次;他所建立的HIT-MW庫,為全世界100多家科研院所采用;目前負責國家自然科學基金項目2項。著有英文專著《Chinese Handwriting Recognition: An Algorithmic Perspective》(德國施普林格出版社),CUDA相關譯作2本(機械工業出版社)。現任哈爾濱工業大學軟件學院高級講師、碩士生導師。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 青岛侦探_青岛侦探事务所_青岛劝退小三_青岛调查出轨取证公司_青岛婚外情取证-青岛探真调查事务所 | 铁艺,仿竹,竹节,护栏,围栏,篱笆,栅栏,栏杆,护栏网,网围栏,厂家 - 河北稳重金属丝网制品有限公司 山东太阳能路灯厂家-庭院灯生产厂家-济南晟启灯饰有限公司 | Eiafans.com_环评爱好者 环评网|环评论坛|环评报告公示网|竣工环保验收公示网|环保验收报告公示网|环保自主验收公示|环评公示网|环保公示网|注册环评工程师|环境影响评价|环评师|规划环评|环评报告|环评考试网|环评论坛 - Powered by Discuz! | 今日扫码_溯源二维码_产品防伪一物一码_红包墙营销方案 | 北京网站建设公司_北京网站制作公司_北京网站设计公司-北京爱品特网站建站公司 | 氟氨基酮、氯硝柳胺、2-氟苯甲酸、异香兰素-新晨化工 | Pos机办理_个人商户免费POS机申请-拉卡拉办理网 | 高温链条油|高温润滑脂|轴承润滑脂|机器人保养用油|干膜润滑剂-东莞卓越化学 | 无菌水质袋-NASCO食品无菌袋-Whirl-Pak无菌采样袋-深圳市慧普德贸易有限公司 | 厦门ISO认证|厦门ISO9001认证|厦门ISO14001认证|厦门ISO45001认证-艾索咨询专注ISO认证行业 | 国产离子色谱仪,红外分光测油仪,自动烟尘烟气测试仪-青岛埃仑通用科技有限公司 | 电动液压篮球架_圆管地埋式篮球架_移动平箱篮球架-强森体育 | 冷凝水循环试验箱-冷凝水试验箱-可编程高低温试验箱厂家-上海巨为(www.juweigroup.com) | 户外环保不锈钢垃圾桶_标识标牌制作_园林公园椅厂家_花箱定制-北京汇众环艺 | 阿尔法-MDR2000无转子硫化仪-STM566 SATRA拉力试验机-青岛阿尔法仪器有限公司 | 杜甫仪器官网|实验室平行反应器|升降水浴锅|台式低温循环泵 | 水质监测站_水质在线分析仪_水质自动监测系统_多参数水质在线监测仪_水质传感器-山东万象环境科技有限公司 | Eiafans.com_环评爱好者 环评网|环评论坛|环评报告公示网|竣工环保验收公示网|环保验收报告公示网|环保自主验收公示|环评公示网|环保公示网|注册环评工程师|环境影响评价|环评师|规划环评|环评报告|环评考试网|环评论坛 - Powered by Discuz! | 天津试验仪器-电液伺服万能材料试验机,恒温恒湿标准养护箱,水泥恒应力压力试验机-天津鑫高伟业科技有限公司 | 电采暖锅炉_超低温空气源热泵_空气源热水器-鑫鲁禹电锅炉空气能热泵厂家 | 河南15年专业网站建设制作设计,做网站就找郑州启凡网络公司 | 南京种植牙医院【官方挂号】_南京治疗种植牙医院那个好_南京看种植牙哪里好_南京茀莱堡口腔医院 尼龙PA610树脂,尼龙PA612树脂,尼龙PA1010树脂,透明尼龙-谷骐科技【官网】 | 深圳工程师职称评定条件及流程_深圳职称评审_职称评审-职称网 | 数控走心机-走心机价格-双主轴走心机-宝宇百科 | 防水套管厂家_刚性防水套管_柔性防水套管_不锈钢防水套管-郑州中泰管道 | 丝杆升降机-不锈钢丝杆升降机-非标定制丝杆升降机厂家-山东鑫光减速机有限公司 | 二手电脑回收_二手打印机回收_二手复印机回_硒鼓墨盒回收-广州益美二手电脑回收公司 | 软瓷_柔性面砖_软瓷砖_柔性石材_MCM软瓷厂家_湖北博悦佳软瓷 | 袋式过滤器,自清洗过滤器,保安过滤器,篮式过滤器,气体过滤器,全自动过滤器,反冲洗过滤器,管道过滤器,无锡驰业环保科技有限公司 | 北京软件开发_软件开发公司_北京软件公司-北京宜天信达软件开发公司 | 小程序开发公司-小程序制作-微信小程序开发-小程序定制-咏熠软件 | 电销卡_北京电销卡_包月电话卡-豪付网络 | 碳纤维复合材料制品生产定制工厂订制厂家-凯夫拉凯芙拉碳纤维手机壳套-碳纤维雪茄盒外壳套-深圳市润大世纪新材料科技有限公司 | 环保袋,无纺布袋,无纺布打孔袋,保温袋,环保袋定制,环保袋厂家,环雅包装-十七年环保袋定制厂家 | 东莞螺杆空压机_永磁变频空压机_节能空压机_空压机工厂批发_深圳螺杆空压机_广州螺杆空压机_东莞空压机_空压机批发_东莞空压机工厂批发_东莞市文颖设备科技有限公司 | 小程序开发公司_APP开发多少钱_软件开发定制_微信小程序制作_客户销售管理软件-济南小溪畅流网络科技有限公司 | 合肥办公室装修 - 合肥工装公司 - 天思装饰 | PAS糖原染色-CBA流式多因子-明胶酶谱MMP-上海研谨生物科技有限公司 | 玄米影院| 哈希余氯测定仪,分光光度计,ph在线监测仪,浊度测定仪,试剂-上海京灿精密机械有限公司 | 数显恒温培养摇床-卧式/台式恒温培养摇床|朗越仪器 |