大數(shù)據(jù)技術(shù)架構(gòu):核心原理與應(yīng)用實(shí)踐 版權(quán)信息
- ISBN:9787121414183
- 條形碼:9787121414183 ; 978-7-121-41418-3
- 裝幀:一般膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>>
大數(shù)據(jù)技術(shù)架構(gòu):核心原理與應(yīng)用實(shí)踐 本書特色
適讀人群 :大數(shù)據(jù)行業(yè)從業(yè)人員技術(shù)暢銷書《大型網(wǎng)站技術(shù)架構(gòu):核心原理與案例分析》作者李智慧老師的又一本力作。本書沿續(xù)了他一貫的寫作風(fēng)格:用簡單易懂的表達(dá)方式,將復(fù)雜的技術(shù)體系一一拆解、融入有趣的講解當(dāng)中,剖析學(xué)習(xí)中的各個(gè)疑難點(diǎn),直接領(lǐng)略技術(shù)的本質(zhì),不走彎路! 本書既適合零基礎(chǔ)學(xué)習(xí)大數(shù)據(jù)技術(shù)入門使用,也適合有經(jīng)驗(yàn)的工程師,了解大數(shù)據(jù)技術(shù)的思路,掌握心法、舉一反三、更好地運(yùn)用于實(shí)踐工作。
大數(shù)據(jù)技術(shù)架構(gòu):核心原理與應(yīng)用實(shí)踐 內(nèi)容簡介
在人工智能時(shí)代,不論是否從事大數(shù)據(jù)開發(fā),掌握大數(shù)據(jù)的原理和架構(gòu)早已成為每個(gè)工程師的推薦技能。本書結(jié)合作者多年大數(shù)據(jù)開發(fā)、應(yīng)用的經(jīng)驗(yàn),深入淺出地闡述大數(shù)據(jù)的完整知識體系,幫助讀者從不同視角找到大數(shù)據(jù)方向的突破口,真正從普通開發(fā)者晉升為擁有大數(shù)據(jù)思維并能解決復(fù)雜問題的技術(shù)專家。本書一共分為7章,分別是大數(shù)據(jù)的前世今生與應(yīng)用場景、Hadoop大數(shù)據(jù)原理與架構(gòu)、大數(shù)據(jù)生態(tài)體系主要產(chǎn)品原理與架構(gòu)、大數(shù)據(jù)開發(fā)實(shí)踐、大數(shù)據(jù)平臺與系統(tǒng)集成、大數(shù)據(jù)分析與運(yùn)營、大數(shù)據(jù)算法與機(jī)器學(xué)習(xí)。本書既可作為初學(xué)者了解大數(shù)據(jù)技術(shù)的入門指南,也可作為有一定經(jīng)驗(yàn)的工程師深入理解大數(shù)據(jù)思維的有益參考。
大數(shù)據(jù)技術(shù)架構(gòu):核心原理與應(yīng)用實(shí)踐 目錄
1 大數(shù)據(jù)的前世今生與應(yīng)用場景 1
大數(shù)據(jù)的前世今生:大數(shù)據(jù)簡史與大數(shù)據(jù)生態(tài)體系概述 1
從搜索引擎到人工智能:大數(shù)據(jù)應(yīng)用發(fā)展史 6
大數(shù)據(jù)應(yīng)用的搜索引擎時(shí)代 6
大數(shù)據(jù)應(yīng)用的數(shù)據(jù)倉庫時(shí)代 7
大數(shù)據(jù)應(yīng)用的數(shù)據(jù)挖掘時(shí)代 7
大數(shù)據(jù)應(yīng)用的機(jī)器學(xué)習(xí)時(shí)代 8
數(shù)據(jù)驅(qū)動一切:大數(shù)據(jù)全領(lǐng)域應(yīng)用場景分析 10
大數(shù)據(jù)在醫(yī)療健康領(lǐng)域的應(yīng)用 10
大數(shù)據(jù)在社交媒體領(lǐng)域的應(yīng)用 12
大數(shù)據(jù)在金融領(lǐng)域的應(yīng)用 13
大數(shù)據(jù)在新零售領(lǐng)域的應(yīng)用 13
大數(shù)據(jù)在交通領(lǐng)域的應(yīng)用 13
2 Hadoop大數(shù)據(jù)原理與架構(gòu) 15
移動計(jì)算比移動數(shù)據(jù)更劃算 16
從RAID看垂直伸縮到水平伸縮的演化 19
新技術(shù)層出不窮,HDFS依然是存儲的王者 23
為什么說MapReduce既是編程模型又是計(jì)算框架 29
MapReduce如何讓數(shù)據(jù)完成一次旅行 33
MapReduce作業(yè)啟動和運(yùn)行機(jī)制 34
MapReduce數(shù)據(jù)合并與連接機(jī)制 37
為什么把Yarn稱為資源調(diào)度框架 39
程序員應(yīng)該如何學(xué)好大數(shù)據(jù)技術(shù) 44
3 大數(shù)據(jù)生態(tài)體系主要產(chǎn)品原理與架構(gòu) 47
Hive是如何讓MapReduce實(shí)現(xiàn)SQL操作的 47
用MapReduce實(shí)現(xiàn)SQL數(shù)據(jù)分析的原理 48
Hive的架構(gòu) 49
Hive如何實(shí)現(xiàn)join操作 51
人們并沒有覺得MapReduce速度慢,直到Spark出現(xiàn) 53
同樣的本質(zhì),為何Spark可以更高效 57
Spark的計(jì)算階段 57
Spark的作業(yè)管理 61
Spark的執(zhí)行過程 62
BigTable的開源實(shí)現(xiàn):HBase 63
HBase可伸縮架構(gòu) 64
HBase可擴(kuò)展數(shù)據(jù)模型 65
HBase的高性能存儲 66
流式計(jì)算的代表:Storm、Spark Streaming、Flink 68
Storm 68
Spark Streaming 70
Flink 71
ZooKeeper是如何保證數(shù)據(jù)一致性的 74
分布式一致性原理 75
Paxos算法與ZooKeeper架構(gòu) 76
大數(shù)據(jù)技術(shù)應(yīng)用場景分析 80
4 大數(shù)據(jù)開發(fā)實(shí)踐 82
如何自己開發(fā)一個(gè)大數(shù)據(jù)SQL引擎 83
Panthera架構(gòu) 83
Panthera的SQL語法轉(zhuǎn)換 84
比如這條SQL 85
Panthera程序設(shè)計(jì) 85
Spark的性能優(yōu)化案例分析 89
Apache開源社區(qū)的組織和參與方式 90
軟件性能優(yōu)化 91
大數(shù)據(jù)開發(fā)的性能優(yōu)化 91
Spark性能優(yōu)化 92
案例1:Spark任務(wù)文件初始化調(diào)優(yōu) 95
案例2:Spark任務(wù)調(diào)度優(yōu)化 98
案例3:Spark應(yīng)用配置優(yōu)化 102
案例4:操作系統(tǒng)配置優(yōu)化 102
案例5:硬件優(yōu)化 103
大數(shù)據(jù)基準(zhǔn)測試可以帶來什么好處 105
大數(shù)據(jù)基準(zhǔn)測試的應(yīng)用 105
大數(shù)據(jù)基準(zhǔn)測試工具HiBench 107
從大數(shù)據(jù)性能測試工具Dew看如何快速開發(fā)大數(shù)據(jù)系統(tǒng) 109
Dew設(shè)計(jì)與開發(fā) 110
Akka的原理與應(yīng)用 112
大數(shù)據(jù)開發(fā)實(shí)踐的啟示 115
5 大數(shù)據(jù)平臺與系統(tǒng)集成 117
大數(shù)據(jù)平臺 = 互聯(lián)網(wǎng)產(chǎn)品 + 大數(shù)據(jù)產(chǎn)品 117
數(shù)據(jù)采集 119
數(shù)據(jù)處理 119
數(shù)據(jù)輸出與展示 119
大數(shù)據(jù)任務(wù)調(diào)度 120
大數(shù)據(jù)平臺Lamda架構(gòu) 120
數(shù)據(jù)在大數(shù)據(jù)平臺中的流轉(zhuǎn) 121
大數(shù)據(jù)從哪里來 123
從數(shù)據(jù)庫導(dǎo)入 123
從日志文件導(dǎo)入 124
前端埋點(diǎn)采集 126
爬蟲系統(tǒng) 128
數(shù)據(jù)的熵 128
知名大廠如何搭建大數(shù)據(jù)平臺 129
淘寶大數(shù)據(jù)平臺 129
美團(tuán)大數(shù)據(jù)平臺 130
滴滴大數(shù)據(jù)平臺 131
學(xué)架構(gòu)就是學(xué)架構(gòu)模式 133
盤點(diǎn)可供中小企業(yè)參考的商業(yè)大數(shù)據(jù)平臺 134
大數(shù)據(jù)解決方案提供商 134
大數(shù)據(jù)云計(jì)算服務(wù)商 136
大數(shù)據(jù)SaaS服務(wù)商 138
大數(shù)據(jù)開放平臺 138
當(dāng)大數(shù)據(jù)遇上物聯(lián)網(wǎng) 139
物聯(lián)網(wǎng)應(yīng)用場景分析 139
物聯(lián)網(wǎng)平臺架構(gòu) 140
大數(shù)據(jù)技術(shù)在物聯(lián)網(wǎng)中的應(yīng)用 141
6 大數(shù)據(jù)分析與運(yùn)營 144
老板想要監(jiān)控什么運(yùn)營指標(biāo) 144
互聯(lián)網(wǎng)運(yùn)營的常用數(shù)據(jù)指標(biāo) 145
數(shù)據(jù)可視化圖表與數(shù)據(jù)監(jiān)控 147
一個(gè)用戶新增下降的數(shù)據(jù)分析案例 150
數(shù)據(jù)分析案例 151
數(shù)據(jù)分析方法 154
AB測試與灰度發(fā)布必知必會 156
A/B測試的過程 157
A/B測試的系統(tǒng)架構(gòu) 158
灰度發(fā)布 159
如何利用大數(shù)據(jù)成為“增長黑客” 160
Hotmail的增長黑客故事 161
AARRR用戶增長模型 161
利用大數(shù)據(jù)增長用戶數(shù)量 163
為什么說數(shù)據(jù)驅(qū)動運(yùn)營 164
7 大數(shù)據(jù)算法與機(jī)器學(xué)習(xí) 168
如何對數(shù)據(jù)進(jìn)行分類和預(yù)測 168
k近鄰分類算法 169
數(shù)據(jù)的距離 170
文本的特征值 171
貝葉斯分類 172
如何發(fā)掘數(shù)據(jù)的關(guān)系 174
搜索排序 174
關(guān)聯(lián)分析 177
聚類 179
如何預(yù)測用戶的喜好 181
基于人口統(tǒng)計(jì)的推薦 182
基于商品屬性的推薦 183
基于用戶的協(xié)同過濾推薦 184
基于商品的協(xié)同過濾推薦 185
機(jī)器學(xué)習(xí)的數(shù)學(xué)原理是什么 186
樣本 187
模型 187
算法 188
為什么學(xué)機(jī)器學(xué)習(xí)要學(xué)數(shù)學(xué) 189
從感知機(jī)到神經(jīng)網(wǎng)絡(luò) 190
感知機(jī) 191
神經(jīng)網(wǎng)絡(luò) 192
大數(shù)據(jù)技術(shù)架構(gòu):核心原理與應(yīng)用實(shí)踐 作者簡介
李智慧,同程旅行交通首席架構(gòu)師。曾任阿里巴巴、Intel架構(gòu)師,長期從事分布式系統(tǒng)與大數(shù)據(jù)開發(fā),Apache Spark 代碼貢獻(xiàn)者,騰訊云 TVP,著有暢銷書《大型網(wǎng)站技術(shù)架構(gòu):核心原理與案例分析》。
- >
羅庸西南聯(lián)大授課錄
- >
伊索寓言-世界文學(xué)名著典藏-全譯本
- >
煙與鏡
- >
【精裝繪本】畫給孩子的中國神話
- >
莉莉和章魚
- >
李白與唐代文化
- >
朝聞道
- >
詩經(jīng)-先民的歌唱