中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
高性能之道: SRE視角下的運維架構實踐

包郵 高性能之道: SRE視角下的運維架構實踐

作者:王力 等
出版社:電子工業出版社出版時間:2023-06-01
開本: 其他 頁數: 384
中 圖 價:¥83.8(7.1折) 定價  ¥118.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

高性能之道: SRE視角下的運維架構實踐 版權信息

高性能之道: SRE視角下的運維架構實踐 本書特色

適讀人群 :本書適合互聯網行業內的運維人員、SRE和DevOps工程師、架構師、技術團隊負責人及關注用戶體驗的相關開發者閱讀,也適合掌握了一定的SRE方法論但在實踐中無從下手的讀者閱讀。本書亮點和創新技術實踐思路√ SRE性能優化漏斗優化法則:全書用十幾個章節介紹相關技術實踐,體現了整個法則的收益。√ 標準和規范治理平臺的設計思路:是解決技術體系各項規范落地難、長期治理效果差的閉環解決方案。√ HTTP故障降級理論和實踐:從電商平臺業務中抽象出降級模型,提出了創新的故障降級解決方案,相關思路不局限于解決電商平臺業務問題,還可以擴展到其他一些領域(前提是運維人員深刻理解業務)。√ 云原生可觀測性開源工具Kindling的介紹及實踐價值:針對目前云原生下海量日志分析難、定位問題難等進行的優秀實踐。√ 全視角解讀運維架構建設中的各種矛盾和破解思路。

高性能之道: SRE視角下的運維架構實踐 內容簡介

本書從實踐出發,包括了作者參與并主導的3家電商互聯網公司架構從0到1的構建經歷,從多個角度講解穩定、性能、效率、成本四大職責落地經驗,并結合Mikey金字塔進行了部分創新,很多內容都可以直接復用于實際工作。本書分為7篇,分別是開端篇、監控篇、故障篇、容量篇、全局視角篇、性能篇和擴展篇。 本書適合互聯網行業內的運維人員、SRE和DevOps工程師、架構師、技術團隊負責人及關注用戶體驗的相關開發者閱讀,也適合掌握了一定的SRE方法論但在實踐中無從下手的讀者閱讀。

高性能之道: SRE視角下的運維架構實踐 目錄

開端篇 弱化邊界感

第1章 引言3

1.1運維架構和SRE3

1.2理解業務,技術為業務服務5

1.3不設邊界6

1.4SRE金字塔6

1.5總結7

第2章 重視測試環境和預發布環境8

2.1提效和維穩的**道門檻——測試環境9

2.1.1低級錯誤9

2.1.2提效分析10

2.2“守門員”——預發布環境11

2.2.1低級錯誤11

2.2.2提效分析12

2.3兩大環境問題根本原因溯源12

2.4微拍堂測試環境治理思路介紹13

2.5總結17

監控篇 底層邏輯的藝術

第3章 淺談監控系統設計21

3.1梳理監控體系21

3.2梳理監控指標22

3.3變更監控25

3.4準實時系統監控25

3.5短時進程追蹤工具27

3.6全鏈路監控27

3.7商業監控平臺的選用建議28

3.8監控方式:白盒監控與黑盒監控29

3.9從監控數據中總結規律30

3.10黃金指標30

3.11總結31

第4章 云原生可觀測性開源工具——Kindling32

4.1行業現狀32

4.2Kindling解決方案——關聯內核可觀測性數據的Trace34

4.3Kindling探針的架構設計理念37

4.4Kindling探針架構38

4.4.1內核態程序:drivers38

4.4.2用戶態C/C++程序:kindling-probe38

4.4.3用戶態Go程序:kindling-collector39

4.4.4程序間通信方式40

4.5在線Demo介紹41

4.6案例分享42

4.6.1安裝43

4.6.2功能介紹44

4.6.3穩定性價值47

4.7總結48

第5章 高階實戰——打造可持續維護的閉環流程49

5.1案例:動態觀測SQL質量流程設計50

5.1.1分析規范難以落地的原因50

5.1.2監督與管控流程設計51

5.1.3通知和統計57

5.2案例:WebP格式圖片的規范和落地實踐57

5.2.1規范無法持續推廣57

5.2.2成本和用戶體驗上的雙贏58

5.2.3計劃實施60

5.2.4管控機制60

5.2.5采集數據信息和數據加工處理60

5.2.6巡檢平臺之規范化監督61

5.3案例:管道通信規范化實踐62

5.3.1我們每天都在使用管道62

5.3.2管道示例場景及性能說明64

5.3.3如何規范管道使用場景66

5.4標準和規范治理平臺67

5.4.1現狀68

5.4.2設計思路68

5.5總結72

第6章 挖掘Nginx的監控價值73

6.1URI指紋服務設計73

6.2Nginx日志分析指南76

6.2.1參數白名單76

6.2.2URI的響應時間和HTTP狀態監控77

6.2.3URI響應字節數波動分析77

6.2.4查詢URL請求的項目79

6.2.5注意HTTPS的透傳80

6.2.6利用Nginx完成動態全鏈路比例調整81

6.3總結82

故障篇 故障的生命周期

第7章 事前治理的方法論85

7.1從故障中總結經驗85

7.2從系統資源層面和日志中巡檢異常86

7.3從標準和規范中尋找閉環之路86

7.4從業務中挖掘基礎服務的使用問題87

7.5技術風險防控運營成本87

7.6總結88

第8章 變更管控設計思路89

8.1變更管控89

8.1.1變更對象89

8.1.2變更發布90

8.1.3變更可灰度91

8.1.4變更可回滾92

8.1.5變更可監控92

8.1.6配置項變更92

8.1.7變更管控思路92

8.2JumpServer使用的藝術及工單交互96

8.3變更三板斧:運維團隊的可監控、可灰度、可回滾實踐98

8.3.1案例:云服務器資源伸縮穩定性98

8.3.2案例:CDNOpenResty的變更策略102

8.4總結106

第9章 輪值的設計思路107

9.1值班模式探究108

9.1.1讓開發人員參與其中108

9.1.2制定KPI109

9.1.3值班人員的邊界探討110

9.2值班機器人111

9.3提升值班價值——SRE需求池設計112

9.3.1結合日常巡檢與非值班時間112

9.3.2在煩瑣的工作中收集需求112

9.4總結113

第10章 故障演練與應急預案114

10.1故障演練緣由114

10.1.1更好地面對系統規模增長帶來的復雜性115

10.1.2提升故障的排查速度115

10.1.3驗證應急預案的正確性115

10.1.4驗證基礎設施的穩定性116

10.1.5驗證監控感知能力116

10.1.6驗證應急流程的順暢度116

10.2故障演練流程116

10.2.1故障演練場景關鍵要素116

10.2.2故障演練預期117

10.3應急預案119

10.3.1應急場景標準化120

10.3.2梳理應急預案清單120

10.4總結121

第11章 應急響應流程實踐122

11.1收攏故障上報來源122

11.1.1從技術體系內部發現122

11.1.2從技術體系外部發現123

11.2建立應急小組123

11.2.1人多力量弱123

11.2.2穩定性接口人和崗位權限123

11.2.3完善客訴標準化術語124

11.3故障噪點治理124

11.3.1報警治理124

11.3.2設計外部反饋閾值125

11.3.3收集第三方抖動事件125

11.4控制應急節奏126

11.4.1舍小保大126

11.4.2“優先止血”,后續定位根本原因127

11.4.3及時同步信息,減少信息差127

11.5應急“止血”的常見操作127

11.5.1代碼回滾127

11.5.2重啟128

11.5.3時序監控下的限流、熔斷、擴容129

11.5.4業務降級130

11.5.5阻斷慢查詢131

11.5.6網絡與運營商131

11.5.7重識監控132

11.6總結132

第12章 靜態容災降級系統133

12.1荊棘之路134

12.2設計之路136

12.3架構流程圖138

12.3.1反向代理系統138

12.3.2日志分析系統138

12.3.3后臺系統——利用URI指紋服務138

12.3.4爬蟲系統139

12.3.5容災的緩存系統140

12.3.6基于時間的版本用途140

12.3.7異地容災141

12.4核心代碼解說142

12.4.1Ngx_Lua應用142

12.4.2爬蟲和日志分析系統的關系143

12.4.3完全容災和部分容災功能144

12.5靜態容災的智能關閉方案145

12.5.1從日志分析系統復制請求145

12.5.2利用GoReplay復制流量145

12.5.3利用Nginx的mirror鏡像功能146

12.5.4灰度驗證容災系統緩存——閉環設計147

12.6替換爬蟲的新思路148

12.7總結148

第13章 基于OpenResty的動態限流設計思路150

13.1常見反向代理限流方案缺點分析150

13.2動態限流設計思路151

13.3多維度限流154

13.4智能感知響應能力動態控速設計方案157

13.5屏蔽慢請求帶來的服務阻塞159

13.6總結160

第14章 故障復盤161

14.1復盤前161

14.2復盤中161

14.3復盤后164

14.4自省164

14.5跨部門分享165

14.6故障庫165

14.7總結165

容量篇 性能與成本間的平衡

第15章 成本優化169

15.1成本優化事前準備169

15.1.1目標的制定和價值體現170

15.1.2IT成本與人力成本的權衡170

15.1.3提升對系統的理解171

15.1.4評估優化前后的數據統計及業務影響171

15.1.5從用戶體驗看待成本優化173

15.1.6梳理業務和資源的關系173

15.2公有云基礎資源優化實踐174

15.2.1成本管理白皮書174

15.2.2合理化資源使用率177

15.2.3自建產品和云產品的使用場景優化178

15.2.4基于業務場景的成本控制179

15.3總結180

第16章 智能伸縮平臺181

16.1彈性伸縮平臺關鍵路徑盤點181

16.2基礎設施建設182

16.2.1基于Pod的HPA傳統模式182

16.2.2基于Cluster-Autoscaler的Node伸縮184

16.3基于業務場景的實戰189

16.3.1定時伸縮189

16.3.2基于預測的彈性伸縮191

16.4風險控制體系199

16.4.1動態限流觸發規則199

16.4.2擴容節點失敗和業務降級200

16.5總結200

第17章 容量規劃201

17.1容量規劃現狀201

17.2容量規劃建設思路202

17.2.1建設核心202

17.2.2建設思路203

17.3應用系統容量規劃說明204

17.4基于巡檢模式的容量評估流程205

17.4.1對流量來源的梳理205

17.4.2對容量對象的梳理206

17.4.3收集日常關鍵性數據207

17.5對容量規劃關注點的梳理210

17.5.1壓力測試210

17.5.2業務放量212

17.5.3大促活動213

17.5.4秒殺業務214

17.5.5關注運營活動計劃214

17.5.6尖刺限流215

17.6總結215

第18章 編程能力216

18.1養成寫偽代碼的習慣216

18.2養成管理代碼的習慣217

18.3編程能力分級218

18.4編程能力更深層的價值探討219

18.4.1如何看待PHP短連接問題219

18.4.2理解Redis和Memcached在業務場景上的區別220

18.4.3進程、線程、協程在Linux系統中的表現221

18.4.4探究阻塞和非阻塞、異步和同步在系統中的表現223

18.4.5共享內存224

18.4.6嘗試一些導致進程崩潰的操作224

18.4.7學習秒殺系統的業務架構225

18.4.8給自己的代碼做閉環實踐226

18.4.9參與業務開發日常226

18.5熟悉編程語言特性226

18.6通過系統分析倒推應用配置問題227

18.6.1通過access函數發現PHP性能問題227

18.6.2Java連接池失效228

18.7總結229

全局視角篇 運維破圈

第19章 開啟測試視角233

19.1測試人員的職責邊界233

19.2壓力測試234

19.2.1壓測黑名單思維235

19.2.2壓測利器Wrk235

19.2.3流量鏡像工具GoReplay235

19.3自動化測試監控平臺設計237

19.3.1“牽一發而動全身”的迭代238

19.3.2OpenDiffy介紹238

19.3.3變更管控的支撐系統OpenDiffy+GoReplay239

19.4破壞性測試探究239

19.5從前端的體驗“找碴兒”240

19.5.1基于瀏覽器特性的服務優化240

19.5.2從圖片加載中尋找優化方法241

19.5.3數據埋點的發送頻率242

19.5.4域名的使用限制243

19.5.5請求重復性243

19.5.6PageSpeedInsights分析頁面的加載243

19.5.7定期的內耗分析245

19.6總結245

第20章 開啟用戶視角246

20.1內外兼顧246

20.1.1內部用戶247

20.1.2外部用戶248

20.2建立反饋機制249

20.2.1優化客服反饋機制249

20.2.2與客服合作的案例分享249

20.2.3獎勵機制250

20.2.4關注輿情250

20.3產品體驗——谷歌SRE的高階思維251

20.3.1不僅僅是體驗251

20.3.2交互煩瑣252

20.3.3無人問津252

20.3.4ROI252

20.4防御體系的“誤傷”指南253

20.4.1WAF“誤傷”253

20.4.2內部風控“誤傷”254

20.5關注客戶端環境254

20.5.1客戶端機型配置254

20.5.2網絡255

20.6總結255

第21章 開啟前端和App開發人員視角256

21.1概述256

21.2為什么要解決性能問題257

21.3緩存257

21.3.1強緩存257

21.3.2協商緩存259

21.4網絡請求261

21.4.1HTTP/2.0261

21.4.2DNS預解析262

21.4.3預先建立連接262

21.4.4服務器應該避免過多重定向263

21.5客戶端計算263

21.6預加載265

21.7梳理技術風險265

21.7.1請求阻塞式串行加載266

21.7.2埋點發送過于頻繁266

21.7.3弱網下的資源加載降級266

21.7.4撥測266

21.8總結267

第22章 DNS應用場景實踐268

22.1利用DNS完成故障轉移268

22.2使用HTTPDNS提升訪問穩定性271

22.3提升測試、A/B測試等環境的切換效率273

22.4域名反向解析用途實踐273

22.5內部DNS系統高可用實踐274

22.5.1兩次DNS故障275

22.5.2問題和思考276

22.5.3改進措施278

22.5.4配置及驗證279

22.5.5監控283

22.6總結284

性能篇 SRE進階之路

第23章 高并發網關價值探究287

23.1通用功能介紹287

23.2網關中的聚合模式288

23.2.1Lura啟示錄289

23.2.2APISIX中的batch-requests插件289

23.2.3從GraphQL發現的技術實踐思路291

23.3兼顧緩存的網關設計思路293

23.3.1APISIX的proxy-cache插件293

23.3.2利用聚合拼接緩存資源293

23.3.3鑒權和緩存剝離294

23.4總結295

第24章 高性能Varnish緩存系統296

24.1HTTP緩存對后端服務的價值分析296

24.2CDN緩存和Varnish緩存的共存模式298

24.3安裝Varnish和所需模塊299

24.4配置文件概覽300

24.5穩定性建設所依賴的功能300

24.5.1神圣模式300

24.5.2寬限模式——異步緩存更新302

24.5.3更安穩的軟清除303

24.6*佳實踐304

24.6.1動態緩存時間配置304

24.6.2熱Key及秒殺系統的緩存實踐305

24.6.3后端服務故障轉移306

24.6.4高并發下Varnish啟動參數優化307

24.6.5Varnish配置模板優化實踐307

24.6.6測試環境緩存系統的干擾事件309

24.7總結309

第25章 SRE漏斗優化法則310

25.1SRE性能優化之漏斗優化法則311

25.2漏斗優化法則的技術棧梳理312

25.2.1減少訪問量312

25.2.2減少返回的數據313

25.2.3減少交互次數313

25.2.4降低CPU、內存使用率314

25.2.5提升資源利用率314

25.3總結315

第26章 awesome性能分析工具316

26.1站在巨人的肩膀上工作316

26.1.1系統性能分析常見清單317

26.1.2bcc-tools工具清單319

26.1.3火焰圖320

26.2Netdata320

26.3總結321

第27章 性能優化實踐錦集322

27.1TIME_WAIT優化方案擴展322

27.2利用Ngx_Lua縮短請求鏈路323

27.3eBPF在Kubernetes上的應用325

27.3.1kubectl-trace325

27.3.2使用前提325

27.3.3使用優點325

27.3.4使用場景326

27.3.5安裝326

27.4善用CDN327

27.4.1靜態加速327

27.4.2動態加速328

27.4.3緩存過期保護策略328

27.5記一次中臺服務優化實戰329

27.5.1尋找優化目標330

27.5.2抽絲剝繭——嘗試優化方案331

27.5.3使用gopprof火焰圖發現端倪333

27.5.4回顧復盤337

27.6總結337

擴展篇 在團隊間搭建橋梁

第28章 業務開發人員視角下的技術風險341

28.1了解業務開發人員342

28.1.1工作內容342

28.1.2廢棄十年如一日343

28.1.3重構并非易事343

28.1.4發布前的檢查清單344

28.1.5站在巨人的肩膀上編程344

28.1.6拒絕偽需求345

28.2大淘客之旅346

28.2.1對話高層,達成共識346

28.2.2對話業務線負責人347

28.2.3重識目標,各個擊破347

28.2.4技術氛圍和激勵政策348

28.2.5“曲線救國”的技術路線348

28.3總結351

第29章 SRE視角全篇總結352

29.1齊心協力353

29.1.1關鍵要素353

29.1.2華山論劍353

29.2競品分析——*后1公里355

29.3故障降級系統——來自監控的溝通藝術355

29.3.1抽象業務形態355

29.3.2抽象監控觸發條件357

29.3.3收攏零散性的自愈任務357

29.4重識CMDB價值357

29.5總結358

展開全部

高性能之道: SRE視角下的運維架構實踐 作者簡介

本書主要作者王力,資深技術老兵,《Nginx實戰:基于Lua語言的配置、開發與架構詳解》和《高性能之道:SRE視角下的運維架構實踐》作者。15年互聯網從業經驗,其中有9年電商互聯網開發和運維經驗,這期間擔任過微拍堂運維專家、阿里技術專家、折800運維架構師等,并有5年主導電商大促活動保障的落地經驗,推進過折800、微拍堂兩家電商平臺運維架構從0到1的建設,精通服務的穩定性建設,精通高并發場景下的性能優化和中間件開發,擅長通過架構設計來優化系統復雜度、降本增效。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 120kv/2mA直流高压发生器-60kv/2mA-30kva/50kv工频耐压试验装置-旭明电工 | 淘趣英语网 - 在线英语学习,零基础英语学习网站 | 电杆荷载挠度测试仪-电杆荷载位移-管桩测试仪-北京绿野创能机电设备有限公司 | 阁楼货架_阁楼平台_仓库仓储设备_重型货架_广州金铁牛货架厂 | 英国公司注册-新加坡公司注册-香港公司开户-离岸公司账户-杭州商标注册-杭州优创企业 | 动库网动库商城-体育用品专卖店:羽毛球,乒乓球拍,网球,户外装备,运动鞋,运动包,运动服饰专卖店-正品运动品网上商城动库商城网 - 动库商城 | 光伏家 - 太阳能光伏发电_分布式光伏发电_太阳能光伏网 | 鹤壁创新仪器公司-全自动量热仪,定硫仪,煤炭测硫仪,灰熔点测定仪,快速自动测氢仪,工业分析仪,煤质化验仪器 | 新密高铝耐火砖,轻质保温砖价格,浇注料厂家直销-郑州荣盛窑炉耐火材料有限公司 | 招商帮-一站式网络营销服务|搜索营销推广|信息流推广|短视视频营销推广|互联网整合营销|网络推广代运营|招商帮企业招商好帮手 | 环氧乙烷灭菌器_压力蒸汽灭菌器_低温等离子过氧化氢灭菌器 _低温蒸汽甲醛灭菌器_清洗工作站_医用干燥柜_灭菌耗材-环氧乙烷灭菌器_脉动真空压力蒸汽灭菌器_低温等离子灭菌设备_河南省三强医疗器械有限责任公司 | 二手注塑机回收_旧注塑机回收_二手注塑机买卖 - 大鑫二手注塑机 二手光谱仪维修-德国OBLF光谱仪|进口斯派克光谱仪-热电ARL光谱仪-意大利GNR光谱仪-永晖检测 | 广州迈驰新GMP兽药包装机首页_药品包装机_中药散剂包装机 | 杭州代理记账费用-公司注销需要多久-公司变更监事_杭州福道财务管理咨询有限公司 | 金蝶帐无忧|云代账软件|智能财税软件|会计代账公司专用软件 | 拉伸膜,PE缠绕膜,打包带,封箱胶带,包装膜厂家-东莞宏展包装 | 外贮压-柜式-悬挂式-七氟丙烷-灭火器-灭火系统-药剂-价格-厂家-IG541-混合气体-贮压-非贮压-超细干粉-自动-灭火装置-气体灭火设备-探火管灭火厂家-东莞汇建消防科技有限公司 | 中细软知识产权_专业知识产权解决方案提供商 | 拉伸膜,PE缠绕膜,打包带,封箱胶带,包装膜厂家-东莞宏展包装 | 湖南印刷厂|长沙印刷公司|画册印刷|挂历印刷|台历印刷|杂志印刷-乐成印刷 | 钢结构-钢结构厂房-钢结构工程[江苏海逵钢构厂] | 驾驶式洗地机/扫地机_全自动洗地机_工业洗地机_荣事达工厂官网 | 石家庄网站建设|石家庄网站制作|石家庄小程序开发|石家庄微信开发|网站建设公司|网站制作公司|微信小程序开发|手机APP开发|软件开发 | 粘度计,数显粘度计,指针旋转粘度计 | 一体化预制泵站-一体化提升泵站-一体化泵站厂家-山东康威环保 | 防渗膜厂家|养殖防渗膜|水产养殖防渗膜-泰安佳路通工程材料有限公司 | 重庆小面培训_重庆小面技术培训学习班哪家好【终身免费复学】 | 锌合金压铸-铝合金压铸厂-压铸模具-冷挤压-誉格精密压铸 | 一体化净水器_一体化净水设备_一体化水处理设备-江苏旭浩鑫环保科技有限公司 | 赛默飞Thermo veritiproPCR仪|ProFlex3 x 32PCR系统|Countess3细胞计数仪|371|3111二氧化碳培养箱|Mirco17R|Mirco21R离心机|仟诺生物 | 河南卓美创业科技有限公司-河南卓美防雷公司-防雷接地-防雷工程-重庆避雷针-避雷器-防雷检测-避雷带-避雷针-避雷塔、机房防雷、古建筑防雷等-山西防雷公司 | 北京亦庄厂房出租_经开区产业园招商信息平台 | 东莞动力锂电池保护板_BMS智能软件保护板_锂电池主动均衡保护板-东莞市倡芯电子科技有限公司 | 818手游网_提供当下热门APP手游_最新手机游戏下载 | 酒糟烘干机-豆渣烘干机-薯渣烘干机-糟渣烘干设备厂家-焦作市真节能环保设备科技有限公司 | QQ房产导航-免费收录优秀房地产网站_房地产信息网 | 高低温试验箱-模拟高低温试验箱订制-北京普桑达仪器科技有限公司【官网】 | 品牌策划-品牌设计-济南之式传媒广告有限公司官网-提供品牌整合丨影视创意丨公关活动丨数字营销丨自媒体运营丨数字营销 | 工业插头-工业插头插座【厂家】-温州罗曼电气 | 湖南自考_湖南自学考试| 北京成考网-北京成人高考网 |