中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >>
CUDA 編程:基礎與實踐

包郵 CUDA 編程:基礎與實踐

作者:樊哲勇
出版社:清華大學出版社出版時間:2020-10-01
開本: 16開 頁數: 196
本類榜單:教材銷量榜
中 圖 價:¥58.3(8.4折) 定價  ¥69.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

CUDA 編程:基礎與實踐 版權信息

CUDA 編程:基礎與實踐 本書特色

本書是一本理想的學習 CUDA 編程的入門書籍,理論與實操結合,難易適中。 本書用大量簡單的代碼展示 CUDA 編程的基礎 ;用一個具體的例子——分子動力學模擬程序開發——展示如何一步一步地開發大型的、高效的 CUDA 程序。

CUDA 編程:基礎與實踐 內容簡介

CUDA 是目前較為流行的GPU 高性能計算的開發工具之一。本書通過大量實例系統地講述CUDA 編程的重要方面。前12 章通過一些簡短的例子循序漸進地介紹CUDA 編程的基礎知識,主要包括GPU 硬件與CUDA 程序開發工具(第1 章)、CUDA 中的線程組織(第2 章)、CUDA 程序的基本框架與錯誤檢測(第3、4 章)、獲得GPU 加速的關鍵(第5 章)、CUDA中的內存組織與各種內存的合理使用(第6~8 章)、原子函數的合理使用(第9 章)、線程束內的基本函數(第10 章)、CUDA 流(第11 章)、統一內存(第12 章)等。后面兩章是可選讀的內容:第13 章綜合運用前述章節中的知識,用CUDA 開發一個簡單的分子動力學模擬程序;第14 章介紹若干CUDA 庫(包括Thrust、cuBLAS、cuSolver 和cuRAND)的使用。 本書適合高等院校理工科專業的本科生和研究生及其他任何對CUDA 編程感興趣的人士閱讀。

CUDA 編程:基礎與實踐 目錄

目 錄 第1章 GPU硬件與CUDA程序開發工具 1 1.1 GPU 硬件簡介 1 1.2 CUDA 程序開發工具 4 1.3 CUDA 開發環境搭建示例 6 1.4 用nvidia-smi檢查與設置設備 7 1.5 其他學習資料 8 第2章 CUDA中的線程組織 10 2.1 C++語言中的HelloWorld程序 10 2.2 CUDA中的HelloWorld程序 11 2.2.1 只有主機函數的CUDA程序 11 2.2.2 使用核函數的CUDA程序 12 2.3 CUDA 中的線程組織 14 2.3.1 使用多個線程的核函數 14 2.3.2 使用線程索引 15 2.3.3 推廣至多維網格 17 2.3.4 網格與線程塊大小的限制 21 2.4 CUDA 中的頭文件 21 2.5 用nvcc編譯CUDA程序 22 第3章 簡單CUDA程序的基本框架 25 3.1 例子:數組相加 25 3.2 CUDA 程序的基本框架 27 3.2.1 隱形的設備初始化 29 3.2.2 設備內存的分配與釋放 29 3.2.3 主機與設備之間數據的傳遞 31 3.2.4 核函數中數據與線程的對應 32 3.2.5 核函數的要求 33 3.2.6 核函數中if語句的必要性 34 3.3 自定義設備函數 35 3.3.1 函數執行空間標識符 35 3.3.2 例子:為數組相加的核函數定義一個設備函數 36 第4章 CUDA程序的錯誤檢測 38 4.1 一個檢測CUDA運行時錯誤的宏函數 38 4.1.1 檢查運行時API函數 40 4.1.2 檢查核函數 42 4.2 用CUDA-MEMCHECK檢查內存錯誤 44 第5章 獲得GPU加速的關鍵 46 5.1 用CUDA事件計時 46 5.1.1 為C++程序計時 47 5.1.2 為CUDA程序計時 48 5.2 幾個影響GPU加速的關鍵因素 50 5.2.1 數據傳輸的比例 50 5.2.2 算術強度 51 5.2.3 并行規模 54 5.2.4 總結 55 5.3 CUDA 中的數學函數庫 55 第6章 CUDA的內存組織 57 6.1 CUDA 的內存組織簡介 57 6.2 CUDA 中不同類型的內存 58 6.2.1 全局內存 58 6.2.2 常量內存 61 6.2.3 紋理內存和表面內存 62 6.2.4 寄存器 62 6.2.5 局部內存 63 6.2.6 共享內存 63 6.2.7 L1和L2緩存 64 6.3 SM 及其占有率 65 6.3.1 SM 的構成 65 6.3.2 SM 的占有率 65 6.4 用CUDA運行時API函數查詢設備 67 第7 章 全局內存的合理使用 70 7.1 全局內存的合并與非合并訪問 70 7.2 例子:矩陣轉置 73 7.2.1 矩陣復制 73 7.2.2 使用全局內存進行矩陣轉置 75 第8 章 共享內存的合理使用 78 8.1 例子:數組歸約計算 78 8.1.1 僅使用全局內存 79 8.1.2 使用共享內存 82 8.1.3 使用動態共享內存 84 8.2 使用共享內存進行矩陣轉置 85 8.3 避免共享內存的bank沖突 86 第9 章 原子函數的合理使用 90 9.1 完全在GPU中進行歸約 90 9.2 原子函數 93 9.3 例子:鄰居列表的建立 95 9.3.1 C++ 版本的開發 96 9.3.2 利用原子操作的CUDA版本 98 9.3.3 不用原子操作的CUDA版本 101 第10章 線程束基本函數與協作組 104 10.1 單指令-多線程執行模式 104 10.2 線程束內的線程同步函數 106 10.3 更多線程束內的基本函數 109 10.3.1 介紹 109 10.3.2 利用線程束洗牌函數進行歸約計算 114 10.4 協作組 116 10.4.1 線程塊級別的協作組 116 10.4.2 利用協作組進行歸約計算 118 10.5 數組歸約程序的進一步優化 119 10.5.1 提高線程利用率 119 10.5.2 避免反復分配與釋放設備內存 122 第11章 CUDA流 124 11.1 CUDA 流概述 124 11.2 在默認流中重疊主機和設備計算 125 11.3 用非默認CUDA流重疊多個核函數的執行 128 11.3.1 核函數執行配置中的流參數 128 11.3.2 重疊多個核函數的例子 129 11.4 用非默認CUDA流重疊核函數的執行與數據傳遞 131 11.4.1 不可分頁主機內存與異步的數據傳輸函數 131 11.4.2 重疊核函數執行與數據傳輸的例子 133 第12章 使用統一內存編程 136 12.1 統一內存簡介 136 12.1.1 統一內存的基本概念 136 12.1.2 使用統一內存對硬件的要求 137 12.1.3 統一內存編程的優勢 137 12.2 統一內存的基本使用方法 137 12.2.1 動態統一內存 138 12.2.2 靜態統一內存 139 12.3 使用統一內存申請超量的內存 140 12.3.1 **個測試 140 12.3.2 第二個測試 142 12.3.3 第三個測試 143 12.4 優化使用統一內存的程序 144 第13章 分子動力學模擬的CUDA程序開發 147 13.1 分子動力學模擬的基本算法和C++實現 147 13.1.1 程序的整體結構 147 13.1.2 分子動力學模擬的基本流程 148 13.1.3 初始條件 149 13.1.4 邊界條件 150 13.1.5 相互作用 152 13.1.6 運動方程的數值積分 156 13.1.7 程序中使用的單位制 157 13.1.8 程序的編譯與運行 158 13.1.9 能量守恒的測試 159 13.1.10 C++ 版本程序運行速度的測試 160 13.2 CUDA 版本的分子動力學模擬程序開發 161 13.2.1 僅加速求力和能量的部分 161 13.2.2 加速全部計算 165 第14章 CUDA標準庫的使用 167 14.1 CUDA 標準庫簡介 167 14.2 Thrust 庫 168 14.2.1 簡介 168 14.2.2 數據結構 168 14.2.3 算法 168 14.2.4 例子:前綴和 169 14.3 cuBLAS 庫 171 14.3.1 簡介 171 14.3.2 例子:矩陣乘法 172 14.4 cuSolver 庫 176 14.4.1 簡介 176 14.4.2 例子:矩陣本征值 177 14.5 cuRAND 庫 181 14.5.1 簡介 181 14.5.2 例子 182
展開全部

CUDA 編程:基礎與實踐 作者簡介

樊哲勇,1983 年生,2010 年在南京大學物理系獲理學博士學位,2010-2012 年在廈門大學物理系做博士后,2012-2014年在芬蘭 Aalto 大學做博士后,2014-2016 在渤海大學任副教授,2016 年至今在芬蘭 Aalto 大學做博士后。擁有 8 年 CUDA 編程經驗,用 CUDA 開發了高效的分子動力學模擬程序 GPUMD 和量子輸運程序 GPUQT,在計算物理的一流期刊《Computer Physics Communications》發表9篇原創論文。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 上海佳武自动化科技有限公司 | 洁净实验室工程-成都手术室净化-无尘车间装修-四川华锐净化公司-洁净室专业厂家 | 双舌接地线-PC68数字式高阻计-ZC36|苏海百科 | 薪动-人力资源公司-灵活用工薪资代发-费用结算-残保金优化-北京秒付科技有限公司 | 西安展台设计搭建_西安活动策划公司_西安会议会场布置_西安展厅设计西安旭阳展览展示 | 高清视频编码器,4K音视频编解码器,直播编码器,流媒体服务器,深圳海威视讯技术有限公司 | 365文案网_全网创意文案句子素材站| 防水套管_柔性防水套管_刚性防水套管-巩义市润达管道设备制造有限公司 | 河南正规膏药生产厂家-膏药贴牌-膏药代加工-修康药业集团官网 | 中央空调温控器_风机盘管温控器_智能_液晶_三速开关面板-中央空调温控器厂家 | 注浆压力变送器-高温熔体传感器-矿用压力传感器|ZHYQ朝辉 | 哈尔滨发电机,黑龙江柴油发电机组-北方星光 | 苏州柯瑞德货架-仓库自动化改造解决方案 | 无锡门窗-系统门窗-阳光房-封阳台-断桥铝门窗厂[窗致美] | 出国劳务公司_正规派遣公司[严海] | 搪玻璃冷凝器_厂家-越宏化工设备 | 新疆散热器,新疆暖气片,新疆电锅炉,光耀暖通公司 | RTO换向阀_VOC高温阀门_加热炉切断阀_双偏心软密封蝶阀_煤气蝶阀_提升阀-湖北霍科德阀门有限公司 | 导电银胶_LED封装导电银胶_半导体封装导电胶厂家-上海腾烁 | 高压直流电源_特种变压器_变压器铁芯-希恩变压器定制厂家 | 鑫达滑石-辽宁鑫达滑石集团 | 厚壁钢管-厚壁无缝钢管-小口径厚壁钢管-大口径厚壁钢管 - 聊城宽达钢管有限公司 | 大通天成企业资质代办_承装修试电力设施许可证_增值电信业务经营许可证_无人机运营合格证_广播电视节目制作许可证 | 曙光腾达官网-天津脚手架租赁-木板架出租-移动门式脚手架租赁「免费搭设」 | 运动木地板_体育木地板_篮球馆木地板_舞台木地板-实木运动地板厂家 | 安德建奇火花机-阿奇夏米尔慢走丝|高维|发那科-北京杰森柏汇 | 顶空进样器-吹扫捕集仪-热脱附仪-二次热解吸仪-北京华盛谱信仪器 | 示波器高压差分探头-国产电流探头厂家-南京桑润斯电子科技有限公司 | 南京PVC快速门厂家南京快速卷帘门_南京pvc快速门_世界500强企业国内供应商_南京美高门业 | TMT观察网_独特视角观察TMT行业 派财经_聚焦数字经济内容服务平台 | 车牌识别道闸_停车场收费系统_人脸识别考勤机_速通门闸机_充电桩厂家_中全清茂官网 | LZ-373测厚仪-华瑞VOC气体检测仪-个人有毒气体检测仪-厂家-深圳市深博瑞仪器仪表有限公司 | 集装箱标准养护室-集装箱移动式养护室-广州璟业试验仪器有限公司 | 蜂窝块状沸石分子筛-吸附脱硫分子筛-萍乡市捷龙环保科技有限公司 | 电动高尔夫球车|电动观光车|电动巡逻车|电动越野车厂家-绿友机械集团股份有限公司 | 自动检重秤-动态称重机-重量分选秤-苏州金钻称重设备系统开发有限公司 | 盘式曝气器-微孔曝气器-管式曝气器-曝气盘-斜管填料 | 郑州市前程水处理有限公司 | 集装箱箱号识别_自重载重图像识别_铁路车号自动识别_OCR图像识别 | 电位器_轻触开关_USB连接器_广东精密龙电子科技有限公司 | 冷凝水循环试验箱-冷凝水试验箱-可编程高低温试验箱厂家-上海巨为(www.juweigroup.com) | 单级/双级旋片式真空泵厂家,2xz旋片真空泵-浙江台州求精真空泵有限公司 |