中圖網小程序
一鍵登錄
更方便
本類五星書更多>
-
>
闖進數學世界――探秘歷史名題
-
>
中醫基礎理論
-
>
當代中國政府與政治(新編21世紀公共管理系列教材)
-
>
高校軍事課教程
-
>
思想道德與法治(2021年版)
-
>
毛澤東思想和中國特色社會主義理論體系概論(2021年版)
-
>
中醫內科學·全國中醫藥行業高等教育“十四五”規劃教材
高性能計算機體系結構 版權信息
- ISBN:9787030733573
- 條形碼:9787030733573 ; 978-7-03-073357-3
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
高性能計算機體系結構 內容簡介
全書分為八個部分。**部分是高性能計算機入門,從基本概念、性能評價、應用領域到演進和發展趨勢為大家做了一個詳細的介紹,讓大家首先對高性能計算機有一個初步的了解。第二部分介紹當前幾種適用于高性能計算機的性能評測集。第三部分主要介紹高性能計算機的體系結構分類、內存系統。第四部分討論高性能計算機的并行計算技術。第五部分介紹高性能計算機的存儲層次。第六部分是針對高性能計算機的互聯網絡的介紹。第七部分是介紹異構計算體系結構。*后,第八部分給出各領域的專用體系結構。
高性能計算機體系結構 目錄
前言
第1章 高性能計算機概述 1
1.1 基本概念 1
1.1.1 計算機性能 1
1.1.2 高性能計算機的定義 3
1.1.3 并行計算 4
1.2 典型高性能計算機的結構剖析 6
1.3 高性能計算機的性能評價 8
1.3.1 峰值性能 8
1.3.2 加速比和效率 9
1.3.3 Amdahl定律 9
1.3.4 Gustafson定律 12
1.3.5 可擴展性 13
1.4 高性能計算機的應用領域 14
1.4.1 尺度超大類問題 14
1.4.2 尺度超小類問題 15
1.4.3 時變超快類問題 15
1.4.4 時變超慢類問題 15
1.4.5 過程超危險類問題 15
1.4.6 過程超昂貴類問題 16
1.4.7 新興領域應用問題 16
1.5 高性能計算機的演進和發展趨勢 17
1.5.1 高性能計算機的發展歷史 17
1.5.2 國產高性能計算機的發展歷程 22
1.5.3 高性能計算機的未來發展趨勢 26
1.6 本章小結 26
課后習題 27
第2章 基準評測集 29
2.1 基準評測介紹 29
2.2 計算性能評測集 30
2.2.1 LINPACK 30
2.2.2 HPCG 33
2.2.3 Graph500 35
2.3 I/O性能評測集 38
2.3.1 MDTest 38
2.3.2 IOR 39
2.3.3 IO500 39
2.4 網絡性能評測集.40
2.4.1 IMB 40
2.4.2 OSU Benchmark 41
2.5 能耗評測集 42
2.6 應用評測集 43
2.6.1 Miniapplication 43
2.6.2 戈登·貝爾獎 44
2.7 本章小結 44
課后習題 45
第3章 高性能計算機的體系結構分類 46
3.1 Flynn分類法 46
3.1.1 SISD 47
3.1.2 SIMD 47
3.1.3 MISD 49
3.1.4 MIMD 50
3.1.5 SIMT 50
3.1.6 計算機體系結構分類圖譜 51
3.2 共享內存系統 52
3.2.1 集中式共享內存系統 52
3.2.2 分布式共享內存系統 54
3.3 分布式內存系統 55
3.3.1 大規模并行處理系統 55
3.3.2 工作站集群系統 56
3.4 高性能計算機體系結構中的重要技術 58
3.4.1 緩存一致性 58
3.4.2 內存一致性 60
3.4.3 同步 61
3.4.4 互連網絡 61
3.5 非馮·諾依曼體系結構計算機 62
3.5.1 馮·諾依曼體系結構的回顧 62
3.5.2 非馮·諾依曼體系結構簡介 63
3.6 本章小結 64
課后習題 65
第4章 高性能處理器的并行計算技術 66
4.1 指令級并行 66
4.1.1 流水線技術 66
4.1.2 指令相關性 70
4.1.3 流水線冒險 71
4.1.4 處理冒險的技術 72
4.1.5 精準異常的處理 73
4.1.6 分支預測 73
4.1.7 ILP增強技術 74
4.2 線程級并行 76
4.2.1 粗粒度多線程并行 77
4.2.2 細粒度多線程并行 78
4.2.3 同步多線程并行 79
4.3 數據級并行 79
4.3.1 SIMD指令集擴展 80
4.3.2 圖形處理器 84
4.4 本章小結 87
課后習題.87
第5章 高性能計算機的存儲層次 89
5.1 存儲層次結構 89
5.2 緩存一致性 90
5.2.1 基于偵聽的緩存一致性協議 92
5.2.2 基于目錄的緩存一致性協議 95
5.2.3 一致性的偽共享現象.97
5.3 內存一致性問題.99
5.3.1 順序一致性 100
5.3.2 松弛一致性 101
5.4 內存屏障方法104
5.4.1 編譯器內存同步 104
5.4.2 CPU內存同步 104
5.4.3 無鎖同步 106
5.5 本章小結 107
課后習題 107
第6章 高性能計算機的互連網絡 108
6.1 基本定義和評價指標 108
6.2 拓撲結構 110
6.2.1 靜態網絡 111
6.2.2 動態網絡 113
6.3 流控機制 117
6.3.1 基于消息的流量控制 118
6.3.2 基于包的流量控制 119
6.3.3 基于片的流量控制 120
6.3.4 基于信用量的流量控制 121
6.4 路由算法 122
6.4.1 路由死鎖問題 122
6.4.2 路由算法的分類 123
6.5 InfiniBand高性能互連網絡 125
6.5.1 InfiniBand層次結構 126
6.5.2 InfiniBand網絡架構 128
6.6 RDMA協議 129
6.6.1 常見的RDMA技術 130
6.6.2 RDMA與傳統協議對比 131
6.7 本章小結 132
課后習題 132
第7章 異構計算體系結構 133
7.1 異構計算的基本概念 133
7.2 CPU GPU異構計算 135
7.2.1 CPU與GPU的對比 135
7.2.2 GPU的架構 137
7.2.3 CUDA編程模型 139
7.2.4 CUDA內存模型 143
7.2.5 CUDA執行模型 144
7.3 CPU FPGA異構計算 146
7.3.1 FPGA的基本架構 146
7.3.2 OpenCL編程模型 147
7.3.3 OpenCL內存模型 149
7.3.4 OpenCL執行模型 150
7.4 本章小結 152
課后習題 152
第8章 領域專用體系結構 153
8.1 面向深度神經網絡的領域專用體系結構 153
8.1.1 深度神經網絡簡介 153
8.1.2 張量處理單元 154
8.1.3 神經網絡處理單元 160
8.1.4 神經網絡領域專用體系結構未來展望 162
8.2 面向類腦計算的領域專用體系結構 163
8.2.1 類腦計算簡介 164
8.2.2 清華大學“天機”類腦體系結構 166
8.2.3 其他類腦體系結構 167
8.3 面向圖計算的領域專用體系結構 168
8.3.1 圖計算 168
8.3.2 面向圖計算的領域專用體系結構分類 170
8.4 本章小結 172
課后習題 173
參考文獻 174
第1章 高性能計算機概述 1
1.1 基本概念 1
1.1.1 計算機性能 1
1.1.2 高性能計算機的定義 3
1.1.3 并行計算 4
1.2 典型高性能計算機的結構剖析 6
1.3 高性能計算機的性能評價 8
1.3.1 峰值性能 8
1.3.2 加速比和效率 9
1.3.3 Amdahl定律 9
1.3.4 Gustafson定律 12
1.3.5 可擴展性 13
1.4 高性能計算機的應用領域 14
1.4.1 尺度超大類問題 14
1.4.2 尺度超小類問題 15
1.4.3 時變超快類問題 15
1.4.4 時變超慢類問題 15
1.4.5 過程超危險類問題 15
1.4.6 過程超昂貴類問題 16
1.4.7 新興領域應用問題 16
1.5 高性能計算機的演進和發展趨勢 17
1.5.1 高性能計算機的發展歷史 17
1.5.2 國產高性能計算機的發展歷程 22
1.5.3 高性能計算機的未來發展趨勢 26
1.6 本章小結 26
課后習題 27
第2章 基準評測集 29
2.1 基準評測介紹 29
2.2 計算性能評測集 30
2.2.1 LINPACK 30
2.2.2 HPCG 33
2.2.3 Graph500 35
2.3 I/O性能評測集 38
2.3.1 MDTest 38
2.3.2 IOR 39
2.3.3 IO500 39
2.4 網絡性能評測集.40
2.4.1 IMB 40
2.4.2 OSU Benchmark 41
2.5 能耗評測集 42
2.6 應用評測集 43
2.6.1 Miniapplication 43
2.6.2 戈登·貝爾獎 44
2.7 本章小結 44
課后習題 45
第3章 高性能計算機的體系結構分類 46
3.1 Flynn分類法 46
3.1.1 SISD 47
3.1.2 SIMD 47
3.1.3 MISD 49
3.1.4 MIMD 50
3.1.5 SIMT 50
3.1.6 計算機體系結構分類圖譜 51
3.2 共享內存系統 52
3.2.1 集中式共享內存系統 52
3.2.2 分布式共享內存系統 54
3.3 分布式內存系統 55
3.3.1 大規模并行處理系統 55
3.3.2 工作站集群系統 56
3.4 高性能計算機體系結構中的重要技術 58
3.4.1 緩存一致性 58
3.4.2 內存一致性 60
3.4.3 同步 61
3.4.4 互連網絡 61
3.5 非馮·諾依曼體系結構計算機 62
3.5.1 馮·諾依曼體系結構的回顧 62
3.5.2 非馮·諾依曼體系結構簡介 63
3.6 本章小結 64
課后習題 65
第4章 高性能處理器的并行計算技術 66
4.1 指令級并行 66
4.1.1 流水線技術 66
4.1.2 指令相關性 70
4.1.3 流水線冒險 71
4.1.4 處理冒險的技術 72
4.1.5 精準異常的處理 73
4.1.6 分支預測 73
4.1.7 ILP增強技術 74
4.2 線程級并行 76
4.2.1 粗粒度多線程并行 77
4.2.2 細粒度多線程并行 78
4.2.3 同步多線程并行 79
4.3 數據級并行 79
4.3.1 SIMD指令集擴展 80
4.3.2 圖形處理器 84
4.4 本章小結 87
課后習題.87
第5章 高性能計算機的存儲層次 89
5.1 存儲層次結構 89
5.2 緩存一致性 90
5.2.1 基于偵聽的緩存一致性協議 92
5.2.2 基于目錄的緩存一致性協議 95
5.2.3 一致性的偽共享現象.97
5.3 內存一致性問題.99
5.3.1 順序一致性 100
5.3.2 松弛一致性 101
5.4 內存屏障方法104
5.4.1 編譯器內存同步 104
5.4.2 CPU內存同步 104
5.4.3 無鎖同步 106
5.5 本章小結 107
課后習題 107
第6章 高性能計算機的互連網絡 108
6.1 基本定義和評價指標 108
6.2 拓撲結構 110
6.2.1 靜態網絡 111
6.2.2 動態網絡 113
6.3 流控機制 117
6.3.1 基于消息的流量控制 118
6.3.2 基于包的流量控制 119
6.3.3 基于片的流量控制 120
6.3.4 基于信用量的流量控制 121
6.4 路由算法 122
6.4.1 路由死鎖問題 122
6.4.2 路由算法的分類 123
6.5 InfiniBand高性能互連網絡 125
6.5.1 InfiniBand層次結構 126
6.5.2 InfiniBand網絡架構 128
6.6 RDMA協議 129
6.6.1 常見的RDMA技術 130
6.6.2 RDMA與傳統協議對比 131
6.7 本章小結 132
課后習題 132
第7章 異構計算體系結構 133
7.1 異構計算的基本概念 133
7.2 CPU GPU異構計算 135
7.2.1 CPU與GPU的對比 135
7.2.2 GPU的架構 137
7.2.3 CUDA編程模型 139
7.2.4 CUDA內存模型 143
7.2.5 CUDA執行模型 144
7.3 CPU FPGA異構計算 146
7.3.1 FPGA的基本架構 146
7.3.2 OpenCL編程模型 147
7.3.3 OpenCL內存模型 149
7.3.4 OpenCL執行模型 150
7.4 本章小結 152
課后習題 152
第8章 領域專用體系結構 153
8.1 面向深度神經網絡的領域專用體系結構 153
8.1.1 深度神經網絡簡介 153
8.1.2 張量處理單元 154
8.1.3 神經網絡處理單元 160
8.1.4 神經網絡領域專用體系結構未來展望 162
8.2 面向類腦計算的領域專用體系結構 163
8.2.1 類腦計算簡介 164
8.2.2 清華大學“天機”類腦體系結構 166
8.2.3 其他類腦體系結構 167
8.3 面向圖計算的領域專用體系結構 168
8.3.1 圖計算 168
8.3.2 面向圖計算的領域專用體系結構分類 170
8.4 本章小結 172
課后習題 173
參考文獻 174
展開全部
書友推薦
- >
月亮與六便士
- >
唐代進士錄
- >
巴金-再思錄
- >
中國人在烏蘇里邊疆區:歷史與人類學概述
- >
二體千字文
- >
【精裝繪本】畫給孩子的中國神話
- >
上帝之肋:男人的真實旅程
- >
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
本類暢銷