中圖網

>

網絡與數據通信

高性能之道: SRE視角下的運維架構實踐

包郵高性能之道: SRE視角下的運維架構實踐

作者：王力等

出版社：電子工業出版社出版時間：2023-06-01

開本：其他頁數： 384

本類榜單：計算機/網絡銷量榜

中圖價:¥83.8(7.1折) 定價 ~~¥118.0~~ 登錄后可看到會員價

加入購物車收藏

開年大促， 全場包郵

?新疆、西藏除外

本類五星書更多>

>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用

全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用

¥14.4¥45
>
決戰行測5000題(言語理解與表達)

決戰行測5000題(言語理解與表達)

¥44.1¥88
>
軟件性能測試.分析與調優實踐之路

軟件性能測試.分析與調優實踐之路

¥56.2¥69
>
第一行代碼Android

第一行代碼Android

¥55.4¥99
>
JAVA持續交付

JAVA持續交付

¥58.1¥119
>
EXCEL最強教科書(完全版)(全彩印刷)

EXCEL最強教科書(完全版)(全彩印刷)

¥31.1¥69.9
>
深度學習

深度學習

¥92.4¥168

商品詳情
商品評論(0條)

中圖價:¥83.8 加入購物車

版權信息
本書特色
內容簡介
目錄
作者簡介

高性能之道: SRE視角下的運維架構實踐版權信息

ISBN：9787121454585
條形碼：9787121454585 ; 978-7-121-45458-5
裝幀：一般膠版紙
冊數：暫無
重量：暫無
所屬分類：
計算機/網絡
>
網絡與數據通信

高性能之道: SRE視角下的運維架構實踐本書特色

適讀人群：本書適合互聯網行業內的運維人員、SRE和DevOps工程師、架構師、技術團隊負責人及關注用戶體驗的相關開發者閱讀，也適合掌握了一定的SRE方法論但在實踐中無從下手的讀者閱讀。本書亮點和創新技術實踐思路√ SRE性能優化漏斗優化法則：全書用十幾個章節介紹相關技術實踐，體現了整個法則的收益。√ 標準和規范治理平臺的設計思路：是解決技術體系各項規范落地難、長期治理效果差的閉環解決方案。√ HTTP故障降級理論和實踐：從電商平臺業務中抽象出降級模型，提出了創新的故障降級解決方案，相關思路不局限于解決電商平臺業務問題，還可以擴展到其他一些領域（前提是運維人員深刻理解業務）。√ 云原生可觀測性開源工具Kindling的介紹及實踐價值：針對目前云原生下海量日志分析難、定位問題難等進行的優秀實踐。√ 全視角解讀運維架構建設中的各種矛盾和破解思路。

高性能之道: SRE視角下的運維架構實踐內容簡介

本書從實踐出發，包括了作者參與并主導的3家電商互聯網公司架構從0到1的構建經歷，從多個角度講解穩定、性能、效率、成本四大職責落地經驗，并結合Mikey金字塔進行了部分創新，很多內容都可以直接復用于實際工作。本書分為7篇，分別是開端篇、監控篇、故障篇、容量篇、全局視角篇、性能篇和擴展篇。本書適合互聯網行業內的運維人員、SRE和DevOps工程師、架構師、技術團隊負責人及關注用戶體驗的相關開發者閱讀，也適合掌握了一定的SRE方法論但在實踐中無從下手的讀者閱讀。

高性能之道: SRE視角下的運維架構實踐目錄

開端篇　弱化邊界感

第1章　引言3

1.1運維架構和SRE3

1.2理解業務，技術為業務服務5

1.3不設邊界6

1.4SRE金字塔6

1.5總結7

第2章　重視測試環境和預發布環境8

2.1提效和維穩的**道門檻——測試環境9

2.1.1低級錯誤9

2.1.2提效分析10

2.2“守門員”——預發布環境11

2.2.1低級錯誤11

2.2.2提效分析12

2.3兩大環境問題根本原因溯源12

2.4微拍堂測試環境治理思路介紹13

2.5總結17

監控篇　底層邏輯的藝術

第3章　淺談監控系統設計21

3.1梳理監控體系21

3.2梳理監控指標22

3.3變更監控25

3.4準實時系統監控25

3.5短時進程追蹤工具27

3.6全鏈路監控27

3.7商業監控平臺的選用建議28

3.8監控方式：白盒監控與黑盒監控29

3.9從監控數據中總結規律30

3.10黃金指標30

3.11總結31

第4章　云原生可觀測性開源工具——Kindling32

4.1行業現狀32

4.2Kindling解決方案——關聯內核可觀測性數據的Trace34

4.3Kindling探針的架構設計理念37

4.4Kindling探針架構38

4.4.1內核態程序：drivers38

4.4.2用戶態C/C++程序：kindling-probe38

4.4.3用戶態Go程序：kindling-collector39

4.4.4程序間通信方式40

4.5在線Demo介紹41

4.6案例分享42

4.6.1安裝43

4.6.2功能介紹44

4.6.3穩定性價值47

4.7總結48

第5章　高階實戰——打造可持續維護的閉環流程49

5.1案例：動態觀測SQL質量流程設計50

5.1.1分析規范難以落地的原因50

5.1.2監督與管控流程設計51

5.1.3通知和統計57

5.2案例：WebP格式圖片的規范和落地實踐57

5.2.1規范無法持續推廣57

5.2.2成本和用戶體驗上的雙贏58

5.2.3計劃實施60

5.2.4管控機制60

5.2.5采集數據信息和數據加工處理60

5.2.6巡檢平臺之規范化監督61

5.3案例：管道通信規范化實踐62

5.3.1我們每天都在使用管道62

5.3.2管道示例場景及性能說明64

5.3.3如何規范管道使用場景66

5.4標準和規范治理平臺67

5.4.1現狀68

5.4.2設計思路68

5.5總結72

第6章　挖掘Nginx的監控價值73

6.1URI指紋服務設計73

6.2Nginx日志分析指南76

6.2.1參數白名單76

6.2.2URI的響應時間和HTTP狀態監控77

6.2.3URI響應字節數波動分析77

6.2.4查詢URL請求的項目79

6.2.5注意HTTPS的透傳80

6.2.6利用Nginx完成動態全鏈路比例調整81

6.3總結82

故障篇　故障的生命周期

第7章　事前治理的方法論85

7.1從故障中總結經驗85

7.2從系統資源層面和日志中巡檢異常86

7.3從標準和規范中尋找閉環之路86

7.4從業務中挖掘基礎服務的使用問題87

7.5技術風險防控運營成本87

7.6總結88

第8章　變更管控設計思路89

8.1變更管控89

8.1.1變更對象89

8.1.2變更發布90

8.1.3變更可灰度91

8.1.4變更可回滾92

8.1.5變更可監控92

8.1.6配置項變更92

8.1.7變更管控思路92

8.2JumpServer使用的藝術及工單交互96

8.3變更三板斧：運維團隊的可監控、可灰度、可回滾實踐98

8.3.1案例：云服務器資源伸縮穩定性98

8.3.2案例：CDNOpenResty的變更策略102

8.4總結106

第9章　輪值的設計思路107

9.1值班模式探究108

9.1.1讓開發人員參與其中108

9.1.2制定KPI109

9.1.3值班人員的邊界探討110

9.2值班機器人111

9.3提升值班價值——SRE需求池設計112

9.3.1結合日常巡檢與非值班時間112

9.3.2在煩瑣的工作中收集需求112

9.4總結113

第10章　故障演練與應急預案114

10.1故障演練緣由114

10.1.1更好地面對系統規模增長帶來的復雜性115

10.1.2提升故障的排查速度115

10.1.3驗證應急預案的正確性115

10.1.4驗證基礎設施的穩定性116

10.1.5驗證監控感知能力116

10.1.6驗證應急流程的順暢度116

10.2故障演練流程116

10.2.1故障演練場景關鍵要素116

10.2.2故障演練預期117

10.3應急預案119

10.3.1應急場景標準化120

10.3.2梳理應急預案清單120

10.4總結121

第11章　應急響應流程實踐122

11.1收攏故障上報來源122

11.1.1從技術體系內部發現122

11.1.2從技術體系外部發現123

11.2建立應急小組123

11.2.1人多力量弱123

11.2.2穩定性接口人和崗位權限123

11.2.3完善客訴標準化術語124

11.3故障噪點治理124

11.3.1報警治理124

11.3.2設計外部反饋閾值125

11.3.3收集第三方抖動事件125

11.4控制應急節奏126

11.4.1舍小保大126

11.4.2“優先止血”，后續定位根本原因127

11.4.3及時同步信息，減少信息差127

11.5應急“止血”的常見操作127

11.5.1代碼回滾127

11.5.2重啟128

11.5.3時序監控下的限流、熔斷、擴容129

11.5.4業務降級130

11.5.5阻斷慢查詢131

11.5.6網絡與運營商131

11.5.7重識監控132

11.6總結132

第12章　靜態容災降級系統133

12.1荊棘之路134

12.2設計之路136

12.3架構流程圖138

12.3.1反向代理系統138

12.3.2日志分析系統138

12.3.3后臺系統——利用URI指紋服務138

12.3.4爬蟲系統139

12.3.5容災的緩存系統140

12.3.6基于時間的版本用途140

12.3.7異地容災141

12.4核心代碼解說142

12.4.1Ngx_Lua應用142

12.4.2爬蟲和日志分析系統的關系143

12.4.3完全容災和部分容災功能144

12.5靜態容災的智能關閉方案145

12.5.1從日志分析系統復制請求145

12.5.2利用GoReplay復制流量145

12.5.3利用Nginx的mirror鏡像功能146

12.5.4灰度驗證容災系統緩存——閉環設計147

12.6替換爬蟲的新思路148

12.7總結148

第13章　基于OpenResty的動態限流設計思路150

13.1常見反向代理限流方案缺點分析150

13.2動態限流設計思路151

13.3多維度限流154

13.4智能感知響應能力動態控速設計方案157

13.5屏蔽慢請求帶來的服務阻塞159

13.6總結160

第14章　故障復盤161

14.1復盤前161

14.2復盤中161

14.3復盤后164

14.4自省164

14.5跨部門分享165

14.6故障庫165

14.7總結165

容量篇　性能與成本間的平衡

第15章　成本優化169

15.1成本優化事前準備169

15.1.1目標的制定和價值體現170

15.1.2IT成本與人力成本的權衡170

15.1.3提升對系統的理解171

15.1.4評估優化前后的數據統計及業務影響171

15.1.5從用戶體驗看待成本優化173

15.1.6梳理業務和資源的關系173

15.2公有云基礎資源優化實踐174

15.2.1成本管理白皮書174

15.2.2合理化資源使用率177

15.2.3自建產品和云產品的使用場景優化178

15.2.4基于業務場景的成本控制179

15.3總結180

第16章　智能伸縮平臺181

16.1彈性伸縮平臺關鍵路徑盤點181

16.2基礎設施建設182

16.2.1基于Pod的HPA傳統模式182

16.2.2基于Cluster-Autoscaler的Node伸縮184

16.3基于業務場景的實戰189

16.3.1定時伸縮189

16.3.2基于預測的彈性伸縮191

16.4風險控制體系199

16.4.1動態限流觸發規則199

16.4.2擴容節點失敗和業務降級200

16.5總結200

第17章　容量規劃201

17.1容量規劃現狀201

17.2容量規劃建設思路202

17.2.1建設核心202

17.2.2建設思路203

17.3應用系統容量規劃說明204

17.4基于巡檢模式的容量評估流程205

17.4.1對流量來源的梳理205

17.4.2對容量對象的梳理206

17.4.3收集日常關鍵性數據207

17.5對容量規劃關注點的梳理210

17.5.1壓力測試210

17.5.2業務放量212

17.5.3大促活動213

17.5.4秒殺業務214

17.5.5關注運營活動計劃214

17.5.6尖刺限流215

17.6總結215

第18章　編程能力216

18.1養成寫偽代碼的習慣216

18.2養成管理代碼的習慣217

18.3編程能力分級218

18.4編程能力更深層的價值探討219

18.4.1如何看待PHP短連接問題219

18.4.2理解Redis和Memcached在業務場景上的區別220

18.4.3進程、線程、協程在Linux系統中的表現221

18.4.4探究阻塞和非阻塞、異步和同步在系統中的表現223

18.4.5共享內存224

18.4.6嘗試一些導致進程崩潰的操作224

18.4.7學習秒殺系統的業務架構225

18.4.8給自己的代碼做閉環實踐226

18.4.9參與業務開發日常226

18.5熟悉編程語言特性226

18.6通過系統分析倒推應用配置問題227

18.6.1通過access函數發現PHP性能問題227

18.6.2Java連接池失效228

18.7總結229

全局視角篇　運維破圈

第19章　開啟測試視角233

19.1測試人員的職責邊界233

19.2壓力測試234

19.2.1壓測黑名單思維235

19.2.2壓測利器Wrk235

19.2.3流量鏡像工具GoReplay235

19.3自動化測試監控平臺設計237

19.3.1“牽一發而動全身”的迭代238

19.3.2OpenDiffy介紹238

19.3.3變更管控的支撐系統OpenDiffy+GoReplay239

19.4破壞性測試探究239

19.5從前端的體驗“找碴兒”240

19.5.1基于瀏覽器特性的服務優化240

19.5.2從圖片加載中尋找優化方法241

19.5.3數據埋點的發送頻率242

19.5.4域名的使用限制243

19.5.5請求重復性243

19.5.6PageSpeedInsights分析頁面的加載243

19.5.7定期的內耗分析245

19.6總結245

第20章　開啟用戶視角246

20.1內外兼顧246

20.1.1內部用戶247

20.1.2外部用戶248

20.2建立反饋機制249

20.2.1優化客服反饋機制249

20.2.2與客服合作的案例分享249

20.2.3獎勵機制250

20.2.4關注輿情250

20.3產品體驗——谷歌SRE的高階思維251

20.3.1不僅僅是體驗251

20.3.2交互煩瑣252

20.3.3無人問津252

20.3.4ROI252

20.4防御體系的“誤傷”指南253

20.4.1WAF“誤傷”253

20.4.2內部風控“誤傷”254

20.5關注客戶端環境254

20.5.1客戶端機型配置254

20.5.2網絡255

20.6總結255

第21章　開啟前端和App開發人員視角256

21.1概述256

21.2為什么要解決性能問題257

21.3緩存257

21.3.1強緩存257

21.3.2協商緩存259

21.4網絡請求261

21.4.1HTTP/2.0261

21.4.2DNS預解析262

21.4.3預先建立連接262

21.4.4服務器應該避免過多重定向263

21.5客戶端計算263

21.6預加載265

21.7梳理技術風險265

21.7.1請求阻塞式串行加載266

21.7.2埋點發送過于頻繁266

21.7.3弱網下的資源加載降級266

21.7.4撥測266

21.8總結267

第22章　DNS應用場景實踐268

22.1利用DNS完成故障轉移268

22.2使用HTTPDNS提升訪問穩定性271

22.3提升測試、A/B測試等環境的切換效率273

22.4域名反向解析用途實踐273

22.5內部DNS系統高可用實踐274

22.5.1兩次DNS故障275

22.5.2問題和思考276

22.5.3改進措施278

22.5.4配置及驗證279

22.5.5監控283

22.6總結284

性能篇　SRE進階之路

第23章　高并發網關價值探究287

23.1通用功能介紹287

23.2網關中的聚合模式288

23.2.1Lura啟示錄289

23.2.2APISIX中的batch-requests插件289

23.2.3從GraphQL發現的技術實踐思路291

23.3兼顧緩存的網關設計思路293

23.3.1APISIX的proxy-cache插件293

23.3.2利用聚合拼接緩存資源293

23.3.3鑒權和緩存剝離294

23.4總結295

第24章　高性能Varnish緩存系統296

24.1HTTP緩存對后端服務的價值分析296

24.2CDN緩存和Varnish緩存的共存模式298

24.3安裝Varnish和所需模塊299

24.4配置文件概覽300

24.5穩定性建設所依賴的功能300

24.5.1神圣模式300

24.5.2寬限模式——異步緩存更新302

24.5.3更安穩的軟清除303

24.6*佳實踐304

24.6.1動態緩存時間配置304

24.6.2熱Key及秒殺系統的緩存實踐305

24.6.3后端服務故障轉移306

24.6.4高并發下Varnish啟動參數優化307

24.6.5Varnish配置模板優化實踐307

24.6.6測試環境緩存系統的干擾事件309

24.7總結309

第25章　SRE漏斗優化法則310

25.1SRE性能優化之漏斗優化法則311

25.2漏斗優化法則的技術棧梳理312

25.2.1減少訪問量312

25.2.2減少返回的數據313

25.2.3減少交互次數313

25.2.4降低CPU、內存使用率314

25.2.5提升資源利用率314

25.3總結315

第26章　awesome性能分析工具316

26.1站在巨人的肩膀上工作316

26.1.1系統性能分析常見清單317

26.1.2bcc-tools工具清單319

26.1.3火焰圖320

26.2Netdata320

26.3總結321

第27章　性能優化實踐錦集322

27.1TIME_WAIT優化方案擴展322

27.2利用Ngx_Lua縮短請求鏈路323

27.3eBPF在Kubernetes上的應用325

27.3.1kubectl-trace325

27.3.2使用前提325

27.3.3使用優點325

27.3.4使用場景326

27.3.5安裝326

27.4善用CDN327

27.4.1靜態加速327

27.4.2動態加速328

27.4.3緩存過期保護策略328

27.5記一次中臺服務優化實戰329

27.5.1尋找優化目標330

27.5.2抽絲剝繭——嘗試優化方案331

27.5.3使用gopprof火焰圖發現端倪333

27.5.4回顧復盤337

27.6總結337

擴展篇　在團隊間搭建橋梁

第28章　業務開發人員視角下的技術風險341

28.1了解業務開發人員342

28.1.1工作內容342

28.1.2廢棄十年如一日343

28.1.3重構并非易事343

28.1.4發布前的檢查清單344

28.1.5站在巨人的肩膀上編程344

28.1.6拒絕偽需求345

28.2大淘客之旅346

28.2.1對話高層，達成共識346

28.2.2對話業務線負責人347

28.2.3重識目標，各個擊破347

28.2.4技術氛圍和激勵政策348

28.2.5“曲線救國”的技術路線348

28.3總結351

第29章　SRE視角全篇總結352

29.1齊心協力353

29.1.1關鍵要素353

29.1.2華山論劍353

29.2競品分析——*后1公里355

29.3故障降級系統——來自監控的溝通藝術355

29.3.1抽象業務形態355

29.3.2抽象監控觸發條件357

29.3.3收攏零散性的自愈任務357

29.4重識CMDB價值357

29.5總結358

展開全部

高性能之道: SRE視角下的運維架構實踐作者簡介

本書主要作者王力，資深技術老兵，《Nginx實戰：基于Lua語言的配置、開發與架構詳解》和《高性能之道：SRE視角下的運維架構實踐》作者。15年互聯網從業經驗，其中有9年電商互聯網開發和運維經驗，這期間擔任過微拍堂運維專家、阿里技術專家、折800運維架構師等，并有5年主導電商大促活動保障的落地經驗，推進過折800、微拍堂兩家電商平臺運維架構從0到1的建設，精通服務的穩定性建設，精通高并發場景下的性能優化和中間件開發，擅長通過架構設計來優化系統復雜度、降本增效。

商品評論(0條)

寫書評賺書幣

暫無評論……

書友推薦

>
自卑與超越
自卑與超越
[奧]阿爾弗雷德·阿德勒著，韓陽譯
¥16.7~~¥39.8~~
>
朝聞道
朝聞道
劉慈欣
¥16.5~~¥23.8~~
>
名家帶你讀魯迅:故事新編
名家帶你讀魯迅:故事新編
魯迅著，陳漱渝主編
¥13.0~~¥26.0~~
>
詩經-先民的歌唱
詩經-先民的歌唱
裴溥言
¥14.5~~¥39.8~~
>
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)
易竹賢
¥9.9~~¥23.0~~
>
有舍有得是人生
有舍有得是人生
梁實秋
¥25.7~~¥45.0~~
>
人文閱讀與收藏·良友文學叢書:一天的工作
人文閱讀與收藏·良友文學叢書:一天的工作
魯迅
¥15.7~~¥45.8~~
>
推拿
推拿
畢飛宇
¥12.2~~¥32.0~~

本類暢銷

微信背后的產品觀

陳妍，張軍主編

¥62.6~~¥88~~
副本

李婷主編

¥30.6~~¥78~~
云計算(第四版)

劉鵬

¥57.3~~¥88~~
黑客與畫家(10萬冊紀念版)

(美)保羅·格雷厄姆(Paul Grah

¥62.9~~¥99.8~~
不良情緒應急處理包--孤獨感

中圖網

¥12.9~~¥30~~
不良情緒應急處理包--精神內耗

中圖網

¥12.9~~¥30~~

中图网(原中国图书网)：网上书店，尾货特色书店，30万种特价书低至2折！

包郵高性能之道: SRE視角下的運維架構實踐

高性能之道: SRE視角下的運維架構實踐版權信息

高性能之道: SRE視角下的運維架構實踐本書特色

高性能之道: SRE視角下的運維架構實踐內容簡介

高性能之道: SRE視角下的運維架構實踐目錄

高性能之道: SRE視角下的運維架構實踐作者簡介

自卑與超越

朝聞道

名家帶你讀魯迅:故事新編

詩經-先民的歌唱

新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)

有舍有得是人生

人文閱讀與收藏·良友文學叢書:一天的工作

推拿

微信背后的產品觀

副本

云計算(第四版)

黑客與畫家(10萬冊紀念版)

不良情緒應急處理包--孤獨感

不良情緒應急處理包--精神內耗

熊千佳昆蟲記

陶潛和櫻子

俄羅斯書簡

趙元任早年自傳

百年夢憶:梁實秋人生自述

連科六短篇-短篇經典文庫

包郵 高性能之道: SRE視角下的運維架構實踐

高性能之道: SRE視角下的運維架構實踐 版權信息

高性能之道: SRE視角下的運維架構實踐 本書特色

高性能之道: SRE視角下的運維架構實踐 內容簡介

高性能之道: SRE視角下的運維架構實踐 目錄

高性能之道: SRE視角下的運維架構實踐 作者簡介

包郵高性能之道: SRE視角下的運維架構實踐

高性能之道: SRE視角下的運維架構實踐版權信息

高性能之道: SRE視角下的運維架構實踐本書特色

高性能之道: SRE視角下的運維架構實踐內容簡介

高性能之道: SRE視角下的運維架構實踐目錄

高性能之道: SRE視角下的運維架構實踐作者簡介