中图网(原中国图书网):网上书店,中文字幕在线一区二区三区,尾货特色书店,中文字幕在线一区,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
并行計算與高性能計算

包郵 并行計算與高性能計算

出版社:清華大學出版社出版時間:2022-06-01
開本: 16開 頁數: 548
中 圖 價:¥94.5(6.8折) 定價  ¥139.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

并行計算與高性能計算 版權信息

  • ISBN:9787302607373
  • 條形碼:9787302607373 ; 978-7-302-60737-3
  • 裝幀:一般膠版紙
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>

并行計算與高性能計算 本書特色

編寫可擴展的、快速、強大、節能的程序,才適合處理大量數據。使用并行編程,可將數據處理任務分布在多個CPU上完成,從而從根本上提高性能。只需要稍加學習,讀者就可以創建速度和效率的軟件。 《并行計算與高性能計算》將講述用于提高代碼運行效率的技術。你將學習評估硬件架構,學會使用OpenMP和MPI等行業標準工具,將掌握用于高性能計算的數據結構和算法,并學習手持設備的節能技術。你甚至可在一組GPU上運行大規模海嘯仿真程序。

并行計算與高性能計算 內容簡介

主要內容 ●規劃新的并行項目 ●了解CPU和GPU架構上的差異 ●找到性能不佳的內核和循環 ●使用批處理調度來管理應用程序

并行計算與高性能計算 目錄

第Ⅰ部分 并行計算介紹

第1 章 為什么使用并行計算 3

1.1 為什么要學習并行計算 5

1.2 并行計算的基本定律 9

1.3 并行計算如何工作 12

1.4 對并行方法進行分類 24

1.5 并行策略 25

1.6 并行加速與比較加速:兩種不同的衡量標準 26

1.7 你將在本書中學到哪些內容 27

1.8 本章小結 28

第2 章 規劃并行化 29

2.1 處理新項目:準備工作 30

2.2 概要分析:探測系統功能和應用程序性能之間的差距 42

2.3 計劃:成功的基礎 42

2.4 實施 44

2.5 提交:高質量的打包過程 45

2.6 進一步探索 46

2.7 本章小結 46

第3 章 性能極限與分析 49

3.1 了解應用程序的潛在性能限制 49

3.2 了解硬件性能:基準測試 52

3.3 描述你的應用程序:分析 59

3.4 進一步探索 71

3.5 本章小結 71

第4 章 數據設計和性能模型 73

4.1 數據結構與性能:面向數據的設計 74

4.2 緩存未命中的3C:強制、容量與沖突 86

4.3 簡單性能模型:案例研究 90

4.4 高級性能模型 98

4.5 網絡消息 101

4.6 進一步探索 103

4.7 本章小結 104

第5 章 并行算法與模式 105

5.1 并行計算應用的算法分析 105

5.2 性能模型與算法復雜性 106

5.3 什么是并行算法 109

5.4 什么是哈希函數 110

5.5 空間哈希:一種高并行度算法 111

5.6 prefix sum(掃描)模式及其在并行計算中的重要性 132

5.7 并行全局和:解決關聯性問題 135

5.8 并行算法研究的未來 141

5.9 進一步探索 141

5.10 本章小結 142

第II 部分 CPU:并行的主力第6 章 向量化:免費的flop 145

6.1 向量及單指令多數據流(SIMD)概要 145

6.2 向量化的硬件趨勢 146

6.3 向量化方法 147

6.4 實現更好向量化的編程風格 163

6.5 與編譯器向量化相關的編譯器標志 164

6.6 使用OpenMP SIMD 指令實現更好的移植性 170

6.7 進一步探索 172

6.8 本章小結 173

第7 章 使用OpenMP 實現并行計算 175

7.1 OpenMP 介紹 175

7.2 典型的OpenMP 用例:循環級OpenMP、高級OpenMP 和MPI +OpenMP 183

7.3 標準循環級OpenMP 示例 185

7.4 OpenMP 中變量范圍對結果準確性的重要性 193

7.5 函數級OpenMP:使整個函數實現線程并行 194

7.6 使用高級OpenMP 改進并行可伸縮性 196

7.7 使用OpenMP 混合線程及向量化 201

7.8 使用OpenMP 的高級示例 204

7.9 線程工具對健壯程序的重要性 210

7.10 基于任務的支持算法示例 213

7.11 進一步探索 214

7.12 本章小結 215

第8 章 MPI:并行骨干 217

8.1 MPI 程序基礎 217

8.2 用于進程間通信的發送和接收命令 221

8.3 聚合通信:MPI 的強大組件 227

8.4 數據并行示例 236

8.5 使用高級MPI 功能來簡化代碼和啟用優化 245

8.6 通過聯合使用MPI 和OpenMP實現極高的可擴展性 257

8.7 進一步探索 259

8.8 本章小結 261

第III 部分 GPU:加速應用程序運行

第9 章 GPU 架構及概念 265

9.1 作為加速計算平臺的CPU-GPU系統 266

9.2 GPU 和線程引擎 268

9.3 GPU 內存空間的特點 272

9.4 PCI 總線:CPU 與GPU 之間的數據傳輸橋梁 278

9.5 多GPU 平臺和MPI 284

9.6 GPU 加速平臺的潛在收益 286

9.7 何時使用GPU 292

9.8 進一步探索 292

9.9 本章小結 293

第10 章 GPU 編程模型 295

10.1 GPU 編程抽象:通用框架 296

10.2 GPU 編程模型的代碼結構 302

10.3 優化GPU 資源利用 306

10.4 約減模式需要跨工作組進行同步 309

10.5 通過隊列(流)進行異步計算 310

10.6 為GPU 定制并行化應用程序的策略 311

10.7 進一步探索 312

10.8 本章小結 314

第11 章 基于指令的GPU 編程 315

11.1 為GPU 實現應用編譯指令和pragma 的過程 316

11.2 OpenACC:在GPU 上運行的*簡單方法 317

11.2.1 編譯OpenACC 代碼 319

11.2.2 OpenACC 中用于加速計算的并行計算區域 320

11.2.3 使用指令減少CPU 和GPU之間的數據移動 325

11.2.4 優化GPU kernel 329

11.2.5 stream triad 性能結果的總結 334

11.2.6 高級OpenACC 技術 335

11.3 OpenMP:加速器領域的重量級選手 337

11.3.1 編譯OpenMP 代碼 337

11.3.2 使用OpenMP 在GPU 上生成并行工作 339

11.3.3 使用OpenMP 創建數據區域來控制到GPU 的數據移動 342

11.3.4 為GPU 優化OpenMP 346

11.3.5 用于GPU 的高級OpenMP 350

11.4 進一步探索 353

11.4.1 擴展閱讀 353

11.4.2 練習 354

11.5 本章小結 355

第12 章 GPU 語言:深入了解基礎知識 357

12.1 原生GPU 編程語言的特性 358

12.2 CUDA 和HIP GPU 語言:底層性能選項 359

12.2.1 編寫和構建**個CUDA應用程序 360

12.2.2 CUDA 的約減kernel:事情變得復雜 367

12.2.3 Hipifying CUDA 代碼 372

12.3 OpenCL:用于可移植的開源GPU 語言 375

12.3.1 編寫和構建**個OpenCL應用程序 376

12.3.2 OpenCL 中的約減 381

12.4 SYCL:一個成為主流的實驗性C++實現 384

12.5 性能可移植性的高級語言 387

12.5.1 Kokkos:性能可移植性生態系統 387

12.5.2 RAJA 提供更具適應性的性能可移植性層 390

12.6 進一步探索 392

12.6.1 擴展閱讀 392

12.6.2 練習 393

12.7 本章小結 393

第13 章 GPU 配置分析及工具 395

13.1 分析工具概要 395

13.2 如何選擇合適的工作流 396

13.3 問題示例:淺水仿真 397

13.4 分析工作流的示例 400

13.4.1 運行淺水應用程序 400

13.4.2 分析CPU 代碼來制定行動計劃 402

13.4.3 為實施步驟添加OpenACC計算指令 403

13.4.4 添加數據移動指令 405

13.4.5 通過引導分析獲取改進建議 406

13.4.6 強大的輔助開發工具:NVIDIA Nsight 工具套件 408

13.4.7 用于AMD GPU 生態系統的CodeXL 409

13.5 專注于重要指標 409

13.5.1 利用率:是否有足夠的工作量 410

13.5.2 發布效率:你的warp 是否經常停滯? 410

13.5.3 獲得帶寬 411

13.6 使用容器和虛擬機來提供備用工作流 411

13.6.1 將Docker 容器作為解決方案 411

13.6.2 使用VirtualBox 虛擬機 413

13.7 移入云端:提供靈活和可擴展能力 415

13.8 進一步探索 415

13.8.1 擴展閱讀 415

13.8.2 練習 416

13.9 本章小結 416

第Ⅳ部分 高性能計算生態系統

第14 章 關聯性:與kernel 休戰 419

14.1 為什么關聯性很重要 420

14.2 探索架構 421

14.3 OpenMP 的線程關聯 422

14.4 進程關聯性與MPI 429

14.4.1 OpenMPI 的默認進程放置 429

14.4.2 進行控制:在OpenMPI 中指定進程放置的基本技術 430

14.4.3 關聯性不僅僅是進程綁定:全面討論 434

14.5 MPI+OpenMP 的關聯性 436

14.6 從命令行控制關聯性 440

14.6.1 使用hwloc-bind 分配關聯性 440

14.6.2 使用likwid-pin: likwid 工具套件中的關聯工具 441

14.7 展望未來:在運行時設置和更改關聯性 443

14.7.1 在可執行文件中設置關聯性 443

14.7.2 在運行時更改進程關聯性 445

14.8 進一步探索 447

14.8.1 擴展閱讀 447

14.8.2 練習 448

14.9 本章小結 449

第15 章 批處理調度器:為混亂帶來秩序 451

15.1 無管理系統所帶來的混亂 452

15.2 如何順利地在繁忙的集群中部署任務 452

15.2.1 繁忙集群中的批處理系統布局 453

15.2.2 如何合理地在繁忙的集群和HPC 站點上運行任務:HPC 中的推薦做法 453

15.3 提交**個批處理腳本 454

15.4 為長時間運行的作業設定自動重啟 459

15.5 在批處理腳本中指定依賴項 463

15.6 進一步探索 465

15.6.1 擴展閱讀 465

15.6.2 練習 465

15.7 本章小結 466

第16 章 并行環境的文件操作 467

16.1 高性能文件系統的組成部分 467

16.2 標準文件操作:并行到串行(parallel-to-serial)接口 468

16.3 在并行環境中使用MPI

文件操作(MPI-IO) 469

16.4 HDF5 具有自我描述功能,可更好地管理數據 477

16.5 其他并行文件軟件包 485

16.6 并行文件系統:硬件接口 485

16.6.1 并行文件設置 485

16.6.2 適用于所有文件系統的通用提示 489

16.6.3 特定文件系統的提示 490

16.7 進一步探索 493

16.7.1 擴展閱讀 493

16.7.2 練習 494

16.8 本章小結 494

第17 章 用于編寫優質代碼的工具和資源 495

17.1 版本控制系統:一切從這里開始 497

17.1.1 分布式版本控制更適合全局協作 498

17.1.2 通過集中版本控制來簡化操作并提高代碼安全 498

17.2 用于跟蹤代碼性能的計時器例程 499

17.3 分析器:不去衡量就無法提升 500

17.3.1 日常使用的基于文本的分析器 501

17.3.2 用于快速識別瓶頸的高級分析器 502

17.3.3 使用中級分析器來指導應用程序開發 502

17.3.4 通過詳細分析器了解硬件性能的細節信息 504

17.4 benchmark 和mini-apps:了解系統性能的窗口 504

17.4.1 使用benchmark 測量系統性能特征 504

17.4.2 通過mini-apps 提供應用程序的視角 505

17.5 為健壯的應用程序檢測及修復內存錯誤 507

17.5.1 valgrind Memcheck:備用開源方案 507

17.5.2 使用Dr. Memory 診斷內存問題 507

17.5.3 對于要求嚴苛的應用程序使用商業內存檢測工具 509

17.5.4 使用基于編譯器的內存工具來簡化操作 509

17.5.5 通過Fence-post 檢查器來檢測越界內存訪問 510

17.5.6 GPU 應用程序所使用的內存工具 511

17.6 用于檢測競態條件的線程檢查器 512

17.6.1 Intel Inspector:帶有GUI 的競態條件檢測工具 512

17.6.2 Archer:一個基于文本的檢測競態條件的工具 512

17.7 Bug-busters:用于消除bug 的調試器 514

17.7.1 在HPC 站點中廣泛使用的TotalView 調試器 514

17.7.2 DDT:另一種在HPC 站點廣泛使用的調試器 514

17.7.3 Linux 調試器:為本地開發需求提供免費的替代方案 515

17.7.4 通過GPU 調試器消除GPU bug 515

17.8 文件操作分析 516

17.9 包管理器:你的個人系統管理員 519

17.9.1 macOS 的包管理器 519

17.9.2 Windows 包管理器 519

17.9.3 Spack 包管理器:用于高性能計算的包管理器 519

17.10 模塊:加載專門的工具鏈 520

17.10.1 TCL modules:用于加載軟件工具鏈的原始模塊系統 522

17.10.2 Lmod:基于Lua 的替代模塊實現 523

17.11 思考與練習 523

17.12 本章小結 523

附錄A 參考資料 (可從配書網站下載)

附錄B 習題答案 (可從配書網站下載)


展開全部

并行計算與高性能計算 作者簡介

Robert Robey在洛斯阿拉莫斯國家實驗室工作,30多年來一直活躍在并行計算領域。Yuliana Zamora目前是芝加哥大學的博士生及Siebel學者,曾在許多國家會議上講授現代硬件編程技術。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 招商帮-一站式网络营销服务|搜索营销推广|信息流推广|短视视频营销推广|互联网整合营销|网络推广代运营|招商帮企业招商好帮手 | 耐磨陶瓷管道_除渣器厂家-淄博浩瀚陶瓷科技有限公司 | 深圳办公室装修,办公楼/写字楼装修设计,一级资质 - ADD写艺 | 贴片电容代理-三星电容-村田电容-风华电容-国巨电容-深圳市昂洋科技有限公司 | 桁架机器人_桁架机械手_上下料机械手_数控车床机械手-苏州清智科技装备制造有限公司 | 四合院设计_四合院装修_四合院会所设计-四合院古建设计与建造中心1 | 机械立体车库租赁_立体停车设备出租_智能停车场厂家_春华起重 | 上海阳光泵业制造有限公司 -【官方网站】 | 免费个人pos机申请办理-移动pos机刷卡-聚合收款码办理 | 无缝钢管-聊城无缝钢管-小口径无缝钢管-大口径无缝钢管 - 聊城宽达钢管有限公司 | 凝胶成像仪,化学发光凝胶成像系统,凝胶成像分析系统-上海培清科技有限公司 | 英国雷迪地下管线探测仪-雷迪RD8100管线仪-多功能数字听漏仪-北京迪瑞进创科技有限公司 | 英思科GTD-3000EX(美国英思科气体检测仪MX4MX6)百科-北京嘉华众信科技有限公司 | 运动木地板厂家_体育木地板安装_篮球木地板选购_实木运动地板价格 | 济南电缆桥架|山东桥架-济南航丰实业有限公司 | 电梯乘运质量测试仪_电梯安全评估测试仪-武汉懿之刻 | 冷热冲击试验箱_温度冲击试验箱价格_冷热冲击箱排名_林频厂家 | 农业四情_农业气象站_田间小型气象站_智慧农业气象站-山东风途物联网 | 北京易通慧公司从事北京网站优化,北京网络推广、网站建设一站式服务商-北京网站优化公司 | 脑钠肽-白介素4|白介素8试剂盒-研域(上海)化学试剂有限公司 | 拉卡拉POS机官网 - 官方直营POS机办理|在线免费领取 | 拉卡拉POS机官网 - 官方直营POS机办理|在线免费领取 | 上海软件开发-上海软件公司-软件外包-企业软件定制开发公司-咏熠科技 | 杭州厂房降温,车间降温设备,车间通风降温,厂房降温方案,杭州嘉友实业爽风品牌 | 石牌坊价格石牌坊雕刻制作_石雕牌坊牌楼石栏杆厂家_山东嘉祥石雕有限公司 | 综合管廊模具_生态,阶梯护坡模具_检查井模具制造-致宏模具厂家 | 国际线缆连接网 - 连接器_线缆线束加工行业门户网站 | BAUER减速机|ROSSI-MERSEN熔断器-APTECH调压阀-上海爱泽工业设备有限公司 | 展厅设计公司,展厅公司,展厅设计,展厅施工,展厅装修,企业展厅,展馆设计公司-深圳广州展厅设计公司 | 石家庄网站建设|石家庄网站制作|石家庄小程序开发|石家庄微信开发|网站建设公司|网站制作公司|微信小程序开发|手机APP开发|软件开发 | 数控专用机床,专用机床,自动线,组合机床,动力头,自动化加工生产线,江苏海鑫机床有限公司 | 扬州汇丰仪表有限公司 | 一航网络-软件测评官网| 胶泥瓷砖胶,轻质粉刷石膏,嵌缝石膏厂家,腻子粉批发,永康家德兴,永康市家德兴建材厂 | 北京翻译公司-专业合同翻译-医学标书翻译收费标准-慕迪灵 | 东莞市踏板石餐饮管理有限公司_正宗桂林米粉_正宗桂林米粉加盟_桂林米粉加盟费-东莞市棒子桂林米粉 | 南京交通事故律师-专打交通事故的南京律师 | 防勒索软件_数据防泄密_Trellix(原McAfee)核心代理商_Trellix(原Fireeye)售后-广州文智信息科技有限公司 | 上海单片机培训|重庆曙海培训分支机构—CortexM3+uC/OS培训班,北京linux培训,Windows驱动开发培训|上海IC版图设计,西安linux培训,北京汽车电子EMC培训,ARM培训,MTK培训,Android培训 | 沈阳缠绕膜价格_沈阳拉伸膜厂家_沈阳缠绕膜厂家直销 | 车辆定位管理系统_汽车GPS系统_车载北斗系统 - 朗致物联 |