-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
通用圖形處理器設計——GPGPU編程模型與架構原理 版權信息
- ISBN:9787302604648
- 條形碼:9787302604648 ; 978-7-302-60464-8
- 裝幀:80g膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
通用圖形處理器設計——GPGPU編程模型與架構原理 本書特色
本書是國內首部關于GPGPU芯片架構設計系統性介紹的教材,兼顧理論基礎及實現應用,廣采而精取,層層揭開GPGPU芯片原理。本書可作為高等院校、科研機構等相關單位從事理論教學或者計算機學科進行科學研究的科學家、工程師的參考書籍,也可作為高年級本科生和研究生的學習參考書籍。
通用圖形處理器設計——GPGPU編程模型與架構原理 內容簡介
本書是一本通用GPU芯片為基礎實現芯片設計的專業書籍。介紹了GPU的基礎理論,GPGPU的軟硬件架構,相關工具以及優化技術。以通用GPGPU芯片為基礎平臺進行展開,重點深入了芯片的架構設計原理,架構設計理念和程序優化技術,同時以結合AI應用展現性能優勢和特有價值。通過本書,使讀者能系統了解體系結構理論,促進GPGPU芯片架構設計的興趣與學習,不斷了解GPGPU芯片技術的新發展,新技術。本書是國內首部關于GPGPU芯片架構設計系統性介紹的教材,兼顧理論基礎及實現應用,廣采而精取,層層揭開GPGPU芯片原理。本書可作為高等院校、科研機構等相關單位從事理論教學或者計算機學科進行科學研究的科學家、工程師的參考書籍,也可作為高年級本科生和研究生的學習參考書籍。
通用圖形處理器設計——GPGPU編程模型與架構原理 目錄
第1章 GPGPU概述
1.1 GPGPU與并行計算機
1.1.1 并行體系結構
1.1.2 GPU與CPU體系結構對比
1.2 GPGPU發展概述
1.2.1 GPU
1.2.2 從GPU到GPGPU
1.3 現代GPGPU產品
1.3.1 NVIDIA GPGPU
1.3.2 AMD GPGPU
1.3.3 Intel GPGPU
1.3.4 其他GPU
參考文獻
第2章 GPGPU編程模型
2.1 計算模型
2.1.1 數據并行和線程
2.1.2 主機-設備端和內核函數
2.2 線程模型
2.2.1 線程組織與數據索引
2.2.2 線程分配與執行
2.2.3 線程模型小結
2.3 存儲模型
2.3.1 多樣的存儲器類型
2.3.2 存儲資源與線程并行度
2.4 線程同步與通信模型
2.4.1 同步機制
2.4.2 協作組
2.4.3 流與事件
2.4.4 原子操作
2.5 CUDA指令集概述
2.5.1 中間指令PTX
2.5.2 機器指令SASS
參考文獻
第3章 GPGPU控制核心架構
3.1 GPGPU架構概述
3.1.1 CPU-GPGPU異構計算系統
3.1.2 GPGPU架構
3.1.3 擴展討論:架構特點和局限性
3.2 GPGPU指令流水線
3.2.1 前段:取指與譯碼
3.2.2 中段:調度與發射
3.2.3 后段:執行與寫回
3.2.4 擴展討論:線程束指令流水線
3.3 線程分支
3.3.1 謂詞寄存器
3.3.2 SIMT堆棧
3.3.3 分支屏障
3.3.4 擴展討論:更高效的線程分支執行
3.4 線程束調度
3.4.1 線程束并行、調度與發射
3.4.2 基本的調度策略
3.4.3 擴展討論:線程束調度策略優化
3.5 記分牌
3.5.1 數據相關性
3.5.2 GPGPU中的記分牌
3.5.3 擴展討論:記分牌設計優化
3.6 線程塊分配與調度
3.6.1 線程塊并行、分配與調度
3.6.2 基本的線程塊分配與調度策略
3.6.3 擴展討論:線程塊分配與調度策略優化
參考文獻
第4章 GPGPU存儲架構
4.1 GPGPU存儲系統概述
4.1.1 CPU的層次化存儲
4.1.2 GPGPU的存儲層次
4.2 寄存器文件
4.2.1 并行多板塊結構
4.2.2 板塊沖突和操作數收集器
4.2.3 操作數并行訪問時的相關性冒險
4.2.4 擴展討論:寄存器文件的優化設計
4.3 可編程多處理器內的存儲系統
4.3.1 數據通路概述
4.3.2 共享存儲器訪問
4.3.3 L1高速緩存訪問
4.3.4 紋理緩存
4.3.5 擴展討論:片上存儲系統的優化設計
4.4 可編程多處理器外的存儲系統
4.4.1 存儲分區單元
4.4.2 L2緩存
4.4.3 幀緩存單元
4.4.4 全局存儲器
4.5 存儲架構的優化設計
4.5.1 片上存儲資源融合
4.5.2 技術對比與小結
參考文獻
第5章 GPGPU運算單元架構
5.1 數值的表示
5.1.1 整型數據
5.1.2 浮點數據
5.1.3 擴展討論:多樣的浮點數據表示
5.2 GPGPU的運算單元
5.2.1 整型運算單元
5.2.2 浮點運算單元
5.2.3 特殊功能單元
5.2.4 張量核心單元
5.3 GPGPU的運算單元架構
5.3.1 運算單元的組織和峰值算力
5.3.2 實際的指令吞吐率
5.3.3 擴展討論:脈動陣列結構
參考文獻
第6章 GPGPU張量核心架構
6.1 深度神經網絡的計算
6.1.1 深度神經網絡的計算特征
6.1.2 卷積運算方式
6.2 張量核心架構
6.2.1 張量核心架構特征概述
6.2.2 Volta架構中的張量核心
6.2.3 張量核心的發展
6.2.4 擴展討論:張量核心對稀疏的支持
6.3 神經網絡計算的軟件支持
6.4 深度學習評價基準——MLPerf
參考文獻
第7章 總結與展望
7.1 本書內容總結
7.2 GPGPU發展展望
通用圖形處理器設計——GPGPU編程模型與架構原理 作者簡介
景乃鋒,上海交通大學電子信息學院副研究員。博士畢業于上海交通大學。研究方向包括:高性能及高可靠性計算機系統與結構,數字電路及計算機輔助設計等。
- >
【精裝繪本】畫給孩子的中國神話
- >
推拿
- >
李白與唐代文化
- >
伯納黛特,你要去哪(2021新版)
- >
中國歷史的瞬間
- >
月亮虎
- >
龍榆生:詞曲概論/大家小書
- >
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)