-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
高性能之道: SRE視角下的運維架構實踐 版權信息
- ISBN:9787121454585
- 條形碼:9787121454585 ; 978-7-121-45458-5
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
高性能之道: SRE視角下的運維架構實踐 本書特色
適讀人群 :本書適合互聯網行業內的運維人員、SRE和DevOps工程師、架構師、技術團隊負責人及關注用戶體驗的相關開發者閱讀,也適合掌握了一定的SRE方法論但在實踐中無從下手的讀者閱讀。本書亮點和創新技術實踐思路√ SRE性能優化漏斗優化法則:全書用十幾個章節介紹相關技術實踐,體現了整個法則的收益。√ 標準和規范治理平臺的設計思路:是解決技術體系各項規范落地難、長期治理效果差的閉環解決方案。√ HTTP故障降級理論和實踐:從電商平臺業務中抽象出降級模型,提出了創新的故障降級解決方案,相關思路不局限于解決電商平臺業務問題,還可以擴展到其他一些領域(前提是運維人員深刻理解業務)。√ 云原生可觀測性開源工具Kindling的介紹及實踐價值:針對目前云原生下海量日志分析難、定位問題難等進行的優秀實踐。√ 全視角解讀運維架構建設中的各種矛盾和破解思路。
高性能之道: SRE視角下的運維架構實踐 內容簡介
本書從實踐出發,包括了作者參與并主導的3家電商互聯網公司架構從0到1的構建經歷,從多個角度講解穩定、性能、效率、成本四大職責落地經驗,并結合Mikey金字塔進行了部分創新,很多內容都可以直接復用于實際工作。本書分為7篇,分別是開端篇、監控篇、故障篇、容量篇、全局視角篇、性能篇和擴展篇。 本書適合互聯網行業內的運維人員、SRE和DevOps工程師、架構師、技術團隊負責人及關注用戶體驗的相關開發者閱讀,也適合掌握了一定的SRE方法論但在實踐中無從下手的讀者閱讀。
高性能之道: SRE視角下的運維架構實踐 目錄
開端篇 弱化邊界感
第1章 引言3
1.1運維架構和SRE3
1.2理解業務,技術為業務服務5
1.3不設邊界6
1.4SRE金字塔6
1.5總結7
第2章 重視測試環境和預發布環境8
2.1提效和維穩的**道門檻——測試環境9
2.1.1低級錯誤9
2.1.2提效分析10
2.2“守門員”——預發布環境11
2.2.1低級錯誤11
2.2.2提效分析12
2.3兩大環境問題根本原因溯源12
2.4微拍堂測試環境治理思路介紹13
2.5總結17
監控篇 底層邏輯的藝術
第3章 淺談監控系統設計21
3.1梳理監控體系21
3.2梳理監控指標22
3.3變更監控25
3.4準實時系統監控25
3.5短時進程追蹤工具27
3.6全鏈路監控27
3.7商業監控平臺的選用建議28
3.8監控方式:白盒監控與黑盒監控29
3.9從監控數據中總結規律30
3.10黃金指標30
3.11總結31
第4章 云原生可觀測性開源工具——Kindling32
4.1行業現狀32
4.2Kindling解決方案——關聯內核可觀測性數據的Trace34
4.3Kindling探針的架構設計理念37
4.4Kindling探針架構38
4.4.1內核態程序:drivers38
4.4.2用戶態C/C++程序:kindling-probe38
4.4.3用戶態Go程序:kindling-collector39
4.4.4程序間通信方式40
4.5在線Demo介紹41
4.6案例分享42
4.6.1安裝43
4.6.2功能介紹44
4.6.3穩定性價值47
4.7總結48
第5章 高階實戰——打造可持續維護的閉環流程49
5.1案例:動態觀測SQL質量流程設計50
5.1.1分析規范難以落地的原因50
5.1.2監督與管控流程設計51
5.1.3通知和統計57
5.2案例:WebP格式圖片的規范和落地實踐57
5.2.1規范無法持續推廣57
5.2.2成本和用戶體驗上的雙贏58
5.2.3計劃實施60
5.2.4管控機制60
5.2.5采集數據信息和數據加工處理60
5.2.6巡檢平臺之規范化監督61
5.3案例:管道通信規范化實踐62
5.3.1我們每天都在使用管道62
5.3.2管道示例場景及性能說明64
5.3.3如何規范管道使用場景66
5.4標準和規范治理平臺67
5.4.1現狀68
5.4.2設計思路68
5.5總結72
第6章 挖掘Nginx的監控價值73
6.1URI指紋服務設計73
6.2Nginx日志分析指南76
6.2.1參數白名單76
6.2.2URI的響應時間和HTTP狀態監控77
6.2.3URI響應字節數波動分析77
6.2.4查詢URL請求的項目79
6.2.5注意HTTPS的透傳80
6.2.6利用Nginx完成動態全鏈路比例調整81
6.3總結82
故障篇 故障的生命周期
第7章 事前治理的方法論85
7.1從故障中總結經驗85
7.2從系統資源層面和日志中巡檢異常86
7.3從標準和規范中尋找閉環之路86
7.4從業務中挖掘基礎服務的使用問題87
7.5技術風險防控運營成本87
7.6總結88
第8章 變更管控設計思路89
8.1變更管控89
8.1.1變更對象89
8.1.2變更發布90
8.1.3變更可灰度91
8.1.4變更可回滾92
8.1.5變更可監控92
8.1.6配置項變更92
8.1.7變更管控思路92
8.2JumpServer使用的藝術及工單交互96
8.3變更三板斧:運維團隊的可監控、可灰度、可回滾實踐98
8.3.1案例:云服務器資源伸縮穩定性98
8.3.2案例:CDNOpenResty的變更策略102
8.4總結106
第9章 輪值的設計思路107
9.1值班模式探究108
9.1.1讓開發人員參與其中108
9.1.2制定KPI109
9.1.3值班人員的邊界探討110
9.2值班機器人111
9.3提升值班價值——SRE需求池設計112
9.3.1結合日常巡檢與非值班時間112
9.3.2在煩瑣的工作中收集需求112
9.4總結113
第10章 故障演練與應急預案114
10.1故障演練緣由114
10.1.1更好地面對系統規模增長帶來的復雜性115
10.1.2提升故障的排查速度115
10.1.3驗證應急預案的正確性115
10.1.4驗證基礎設施的穩定性116
10.1.5驗證監控感知能力116
10.1.6驗證應急流程的順暢度116
10.2故障演練流程116
10.2.1故障演練場景關鍵要素116
10.2.2故障演練預期117
10.3應急預案119
10.3.1應急場景標準化120
10.3.2梳理應急預案清單120
10.4總結121
第11章 應急響應流程實踐122
11.1收攏故障上報來源122
11.1.1從技術體系內部發現122
11.1.2從技術體系外部發現123
11.2建立應急小組123
11.2.1人多力量弱123
11.2.2穩定性接口人和崗位權限123
11.2.3完善客訴標準化術語124
11.3故障噪點治理124
11.3.1報警治理124
11.3.2設計外部反饋閾值125
11.3.3收集第三方抖動事件125
11.4控制應急節奏126
11.4.1舍小保大126
11.4.2“優先止血”,后續定位根本原因127
11.4.3及時同步信息,減少信息差127
11.5應急“止血”的常見操作127
11.5.1代碼回滾127
11.5.2重啟128
11.5.3時序監控下的限流、熔斷、擴容129
11.5.4業務降級130
11.5.5阻斷慢查詢131
11.5.6網絡與運營商131
11.5.7重識監控132
11.6總結132
第12章 靜態容災降級系統133
12.1荊棘之路134
12.2設計之路136
12.3架構流程圖138
12.3.1反向代理系統138
12.3.2日志分析系統138
12.3.3后臺系統——利用URI指紋服務138
12.3.4爬蟲系統139
12.3.5容災的緩存系統140
12.3.6基于時間的版本用途140
12.3.7異地容災141
12.4核心代碼解說142
12.4.1Ngx_Lua應用142
12.4.2爬蟲和日志分析系統的關系143
12.4.3完全容災和部分容災功能144
12.5靜態容災的智能關閉方案145
12.5.1從日志分析系統復制請求145
12.5.2利用GoReplay復制流量145
12.5.3利用Nginx的mirror鏡像功能146
12.5.4灰度驗證容災系統緩存——閉環設計147
12.6替換爬蟲的新思路148
12.7總結148
第13章 基于OpenResty的動態限流設計思路150
13.1常見反向代理限流方案缺點分析150
13.2動態限流設計思路151
13.3多維度限流154
13.4智能感知響應能力動態控速設計方案157
13.5屏蔽慢請求帶來的服務阻塞159
13.6總結160
第14章 故障復盤161
14.1復盤前161
14.2復盤中161
14.3復盤后164
14.4自省164
14.5跨部門分享165
14.6故障庫165
14.7總結165
容量篇 性能與成本間的平衡
第15章 成本優化169
15.1成本優化事前準備169
15.1.1目標的制定和價值體現170
15.1.2IT成本與人力成本的權衡170
15.1.3提升對系統的理解171
15.1.4評估優化前后的數據統計及業務影響171
15.1.5從用戶體驗看待成本優化173
15.1.6梳理業務和資源的關系173
15.2公有云基礎資源優化實踐174
15.2.1成本管理白皮書174
15.2.2合理化資源使用率177
15.2.3自建產品和云產品的使用場景優化178
15.2.4基于業務場景的成本控制179
15.3總結180
第16章 智能伸縮平臺181
16.1彈性伸縮平臺關鍵路徑盤點181
16.2基礎設施建設182
16.2.1基于Pod的HPA傳統模式182
16.2.2基于Cluster-Autoscaler的Node伸縮184
16.3基于業務場景的實戰189
16.3.1定時伸縮189
16.3.2基于預測的彈性伸縮191
16.4風險控制體系199
16.4.1動態限流觸發規則199
16.4.2擴容節點失敗和業務降級200
16.5總結200
第17章 容量規劃201
17.1容量規劃現狀201
17.2容量規劃建設思路202
17.2.1建設核心202
17.2.2建設思路203
17.3應用系統容量規劃說明204
17.4基于巡檢模式的容量評估流程205
17.4.1對流量來源的梳理205
17.4.2對容量對象的梳理206
17.4.3收集日常關鍵性數據207
17.5對容量規劃關注點的梳理210
17.5.1壓力測試210
17.5.2業務放量212
17.5.3大促活動213
17.5.4秒殺業務214
17.5.5關注運營活動計劃214
17.5.6尖刺限流215
17.6總結215
第18章 編程能力216
18.1養成寫偽代碼的習慣216
18.2養成管理代碼的習慣217
18.3編程能力分級218
18.4編程能力更深層的價值探討219
18.4.1如何看待PHP短連接問題219
18.4.2理解Redis和Memcached在業務場景上的區別220
18.4.3進程、線程、協程在Linux系統中的表現221
18.4.4探究阻塞和非阻塞、異步和同步在系統中的表現223
18.4.5共享內存224
18.4.6嘗試一些導致進程崩潰的操作224
18.4.7學習秒殺系統的業務架構225
18.4.8給自己的代碼做閉環實踐226
18.4.9參與業務開發日常226
18.5熟悉編程語言特性226
18.6通過系統分析倒推應用配置問題227
18.6.1通過access函數發現PHP性能問題227
18.6.2Java連接池失效228
18.7總結229
全局視角篇 運維破圈
第19章 開啟測試視角233
19.1測試人員的職責邊界233
19.2壓力測試234
19.2.1壓測黑名單思維235
19.2.2壓測利器Wrk235
19.2.3流量鏡像工具GoReplay235
19.3自動化測試監控平臺設計237
19.3.1“牽一發而動全身”的迭代238
19.3.2OpenDiffy介紹238
19.3.3變更管控的支撐系統OpenDiffy+GoReplay239
19.4破壞性測試探究239
19.5從前端的體驗“找碴兒”240
19.5.1基于瀏覽器特性的服務優化240
19.5.2從圖片加載中尋找優化方法241
19.5.3數據埋點的發送頻率242
19.5.4域名的使用限制243
19.5.5請求重復性243
19.5.6PageSpeedInsights分析頁面的加載243
19.5.7定期的內耗分析245
19.6總結245
第20章 開啟用戶視角246
20.1內外兼顧246
20.1.1內部用戶247
20.1.2外部用戶248
20.2建立反饋機制249
20.2.1優化客服反饋機制249
20.2.2與客服合作的案例分享249
20.2.3獎勵機制250
20.2.4關注輿情250
20.3產品體驗——谷歌SRE的高階思維251
20.3.1不僅僅是體驗251
20.3.2交互煩瑣252
20.3.3無人問津252
20.3.4ROI252
20.4防御體系的“誤傷”指南253
20.4.1WAF“誤傷”253
20.4.2內部風控“誤傷”254
20.5關注客戶端環境254
20.5.1客戶端機型配置254
20.5.2網絡255
20.6總結255
第21章 開啟前端和App開發人員視角256
21.1概述256
21.2為什么要解決性能問題257
21.3緩存257
21.3.1強緩存257
21.3.2協商緩存259
21.4網絡請求261
21.4.1HTTP/2.0261
21.4.2DNS預解析262
21.4.3預先建立連接262
21.4.4服務器應該避免過多重定向263
21.5客戶端計算263
21.6預加載265
21.7梳理技術風險265
21.7.1請求阻塞式串行加載266
21.7.2埋點發送過于頻繁266
21.7.3弱網下的資源加載降級266
21.7.4撥測266
21.8總結267
第22章 DNS應用場景實踐268
22.1利用DNS完成故障轉移268
22.2使用HTTPDNS提升訪問穩定性271
22.3提升測試、A/B測試等環境的切換效率273
22.4域名反向解析用途實踐273
22.5內部DNS系統高可用實踐274
22.5.1兩次DNS故障275
22.5.2問題和思考276
22.5.3改進措施278
22.5.4配置及驗證279
22.5.5監控283
22.6總結284
性能篇 SRE進階之路
第23章 高并發網關價值探究287
23.1通用功能介紹287
23.2網關中的聚合模式288
23.2.1Lura啟示錄289
23.2.2APISIX中的batch-requests插件289
23.2.3從GraphQL發現的技術實踐思路291
23.3兼顧緩存的網關設計思路293
23.3.1APISIX的proxy-cache插件293
23.3.2利用聚合拼接緩存資源293
23.3.3鑒權和緩存剝離294
23.4總結295
第24章 高性能Varnish緩存系統296
24.1HTTP緩存對后端服務的價值分析296
24.2CDN緩存和Varnish緩存的共存模式298
24.3安裝Varnish和所需模塊299
24.4配置文件概覽300
24.5穩定性建設所依賴的功能300
24.5.1神圣模式300
24.5.2寬限模式——異步緩存更新302
24.5.3更安穩的軟清除303
24.6*佳實踐304
24.6.1動態緩存時間配置304
24.6.2熱Key及秒殺系統的緩存實踐305
24.6.3后端服務故障轉移306
24.6.4高并發下Varnish啟動參數優化307
24.6.5Varnish配置模板優化實踐307
24.6.6測試環境緩存系統的干擾事件309
24.7總結309
第25章 SRE漏斗優化法則310
25.1SRE性能優化之漏斗優化法則311
25.2漏斗優化法則的技術棧梳理312
25.2.1減少訪問量312
25.2.2減少返回的數據313
25.2.3減少交互次數313
25.2.4降低CPU、內存使用率314
25.2.5提升資源利用率314
25.3總結315
第26章 awesome性能分析工具316
26.1站在巨人的肩膀上工作316
26.1.1系統性能分析常見清單317
26.1.2bcc-tools工具清單319
26.1.3火焰圖320
26.2Netdata320
26.3總結321
第27章 性能優化實踐錦集322
27.1TIME_WAIT優化方案擴展322
27.2利用Ngx_Lua縮短請求鏈路323
27.3eBPF在Kubernetes上的應用325
27.3.1kubectl-trace325
27.3.2使用前提325
27.3.3使用優點325
27.3.4使用場景326
27.3.5安裝326
27.4善用CDN327
27.4.1靜態加速327
27.4.2動態加速328
27.4.3緩存過期保護策略328
27.5記一次中臺服務優化實戰329
27.5.1尋找優化目標330
27.5.2抽絲剝繭——嘗試優化方案331
27.5.3使用gopprof火焰圖發現端倪333
27.5.4回顧復盤337
27.6總結337
擴展篇 在團隊間搭建橋梁
第28章 業務開發人員視角下的技術風險341
28.1了解業務開發人員342
28.1.1工作內容342
28.1.2廢棄十年如一日343
28.1.3重構并非易事343
28.1.4發布前的檢查清單344
28.1.5站在巨人的肩膀上編程344
28.1.6拒絕偽需求345
28.2大淘客之旅346
28.2.1對話高層,達成共識346
28.2.2對話業務線負責人347
28.2.3重識目標,各個擊破347
28.2.4技術氛圍和激勵政策348
28.2.5“曲線救國”的技術路線348
28.3總結351
第29章 SRE視角全篇總結352
29.1齊心協力353
29.1.1關鍵要素353
29.1.2華山論劍353
29.2競品分析——*后1公里355
29.3故障降級系統——來自監控的溝通藝術355
29.3.1抽象業務形態355
29.3.2抽象監控觸發條件357
29.3.3收攏零散性的自愈任務357
29.4重識CMDB價值357
29.5總結358
高性能之道: SRE視角下的運維架構實踐 作者簡介
本書主要作者王力,資深技術老兵,《Nginx實戰:基于Lua語言的配置、開發與架構詳解》和《高性能之道:SRE視角下的運維架構實踐》作者。15年互聯網從業經驗,其中有9年電商互聯網開發和運維經驗,這期間擔任過微拍堂運維專家、阿里技術專家、折800運維架構師等,并有5年主導電商大促活動保障的落地經驗,推進過折800、微拍堂兩家電商平臺運維架構從0到1的建設,精通服務的穩定性建設,精通高并發場景下的性能優化和中間件開發,擅長通過架構設計來優化系統復雜度、降本增效。
- >
自卑與超越
- >
朝聞道
- >
名家帶你讀魯迅:故事新編
- >
詩經-先民的歌唱
- >
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)
- >
有舍有得是人生
- >
人文閱讀與收藏·良友文學叢書:一天的工作
- >
推拿