大數(shù)據(jù)導(dǎo)論 版權(quán)信息
- ISBN:9787121488221
- 條形碼:9787121488221 ; 978-7-121-48822-1
- 裝幀:平塑
- 冊(cè)數(shù):暫無
- 重量:暫無
- 所屬分類:>
大數(shù)據(jù)導(dǎo)論 內(nèi)容簡(jiǎn)介
大數(shù)據(jù)導(dǎo)論課程旨在普及大數(shù)據(jù)知識(shí),幫助學(xué)生理解大數(shù)據(jù)的概念及現(xiàn)實(shí)意義,掌握大數(shù)據(jù)的分析、處理和應(yīng)用技術(shù)。本書圍繞大數(shù)據(jù)的基本概念和大數(shù)據(jù)處理的主要環(huán)節(jié)展開,共8章。第1章主要介紹大數(shù)據(jù)的概念和特征、價(jià)值和作用、相關(guān)的政策法規(guī)等;第2章主要介紹大數(shù)據(jù)相關(guān)技術(shù),包括云計(jì)算、人工智能和物聯(lián)網(wǎng);第3章主要介紹大數(shù)據(jù)采集與預(yù)處理的方法;第4章主要介紹大數(shù)據(jù)處理,包括3種主流的大數(shù)據(jù)處理框架(批處理框架Hadoop、流處理框架Storm 及混合處理框架Spark);第5章主要介紹大數(shù)據(jù)分析與挖掘的常用方法,包括數(shù)據(jù)的描述性分析方法、回歸分析方法、數(shù)據(jù)挖掘的典型算法(關(guān)聯(lián)分析算法、分類算法和聚類算法)及數(shù)據(jù)挖掘技術(shù)的典型應(yīng)用等;第6章主要介紹大數(shù)據(jù)可視化的基礎(chǔ)知識(shí)和案例,以及常用的大數(shù)據(jù)可視化工具和軟件(FineBI、Matplotlib 和ECharts 等);第7章主要介紹大數(shù)據(jù)安全相關(guān)知識(shí),包括大數(shù)據(jù)安全與隱私保護(hù)、大數(shù)據(jù)開放與共享,以及與大數(shù)據(jù)安全案例相關(guān)的政策法規(guī);第8 章主要介紹大數(shù)據(jù)在互聯(lián)網(wǎng)、金融、醫(yī)療、工業(yè)和智慧城市方面的應(yīng)用。本書主要面向高等學(xué)校大數(shù)據(jù)相關(guān)專業(yè)的學(xué)生,同時(shí)也適合對(duì)大數(shù)據(jù)技術(shù)感興趣的廣大讀者閱讀。
大數(shù)據(jù)導(dǎo)論 目錄
1.1 數(shù)據(jù) 1
1.1.1 數(shù)據(jù)的構(gòu)成 2
1.1.2 數(shù)據(jù)的存儲(chǔ)容量單位 4
1.2 大數(shù)據(jù)的相關(guān)概念 4
1.2.1 大數(shù)據(jù)的概念 4
1.2.2 大數(shù)據(jù)的基本特征 5
1.3 大數(shù)據(jù)的意義、價(jià)值與作用 6
1.3.1 大數(shù)據(jù)的意義 7
1.3.2 大數(shù)據(jù)的價(jià)值 8
1.3.3 大數(shù)據(jù)的作用 9
1.4 大數(shù)據(jù)時(shí)代的新變革 10
1.4.1 大數(shù)據(jù)帶來的思維變革 10
1.4.2 大數(shù)據(jù)帶來的社會(huì)變革 12
1.5 大數(shù)據(jù)處理的主要環(huán)節(jié) 14
1.6 大數(shù)據(jù)的安全與共享 16
1.6.1 大數(shù)據(jù)的開放與共享 16
1.6.2 大數(shù)據(jù)安全與個(gè)人隱私保護(hù) 17
1.6.3 我國(guó)大數(shù)據(jù)相關(guān)的安全政策法規(guī) 18
1.7 大數(shù)據(jù)的發(fā)展現(xiàn)狀與發(fā)展趨勢(shì) 20
1.7.1 大數(shù)據(jù)的發(fā)展現(xiàn)狀 20
1.7.2 大數(shù)據(jù)的發(fā)展趨勢(shì) 24
1.7.3 大數(shù)據(jù)時(shí)代面臨的技術(shù)挑戰(zhàn) 26
1.8 本章小結(jié) 27
1.9 習(xí)題 27
第2章 大數(shù)據(jù)相關(guān)技術(shù) 29
2.1 云計(jì)算與大數(shù)據(jù) 29
2.1.1 云計(jì)算的基本概念 29
2.1.2 云計(jì)算的基本要素與優(yōu)勢(shì) 31
2.1.3 云計(jì)算的體系架構(gòu) 33
2.1.4 云計(jì)算的核心技術(shù) 36
2.1.5 云計(jì)算的發(fā)展現(xiàn)狀與主流平臺(tái) 38
2.1.6 云計(jì)算與大數(shù)據(jù)的關(guān)系 44
2.2 人工智能與大數(shù)據(jù) 44
2.2.1 人工智能的基本概念 45
2.2.2 人工智能的研究領(lǐng)域 47
2.2.3 人工智能的產(chǎn)業(yè)與應(yīng)用 52
2.2.4 人工智能與大數(shù)據(jù)的關(guān)系 55
2.3 物聯(lián)網(wǎng)與大數(shù)據(jù) 56
2.3.1 物聯(lián)網(wǎng)的基本概念 57
2.3.2 物聯(lián)網(wǎng)的核心技術(shù) 59
2.3.3 物聯(lián)網(wǎng)的產(chǎn)業(yè)與應(yīng)用 62
2.3.4 物聯(lián)網(wǎng)、云計(jì)算、人工智能與大數(shù)據(jù)的關(guān)系 65
2.4 本章小結(jié) 66
2.5 習(xí)題 66
第3章 大數(shù)據(jù)采集與預(yù)處理 68
3.1 認(rèn)識(shí)數(shù)據(jù) 68
3.1.1 數(shù)據(jù)的屬性和類型 68
3.1.2 數(shù)據(jù)的量綱 69
3.2 大數(shù)據(jù)的來源和采集途徑 70
3.2.1 大數(shù)據(jù)的來源 70
3.2.2 大數(shù)據(jù)的采集途徑 70
3.3 常用的大數(shù)據(jù)采集工具 72
3.3.1 爬山虎采集器 72
3.3.2 八爪魚采集器 74
3.3.3 基于Python的網(wǎng)頁(yè)抓取框架Scrapy 75
3.3.4 日志采集工具Flume 76
3.3.5 分布式消息服務(wù)工具Kafka 78
3.4 數(shù)據(jù)預(yù)處理 79
3.4.1 數(shù)據(jù)清洗 79
3.4.2 數(shù)據(jù)集成 83
3.4.3 數(shù)據(jù)變換 84
3.4.4 數(shù)據(jù)歸約 88
3.5 使用OpenRefine對(duì)數(shù)據(jù)進(jìn)行預(yù)處理 88
3.6 本章小結(jié) 93
3.7 習(xí)題 93
第4章 大數(shù)據(jù)處理 95
4.1 大數(shù)據(jù)處理框架 95
4.1.1 主流大數(shù)據(jù)處理框架的簡(jiǎn)介 95
4.1.2 批處理框架Hadoop簡(jiǎn)介 98
4.1.3 流處理框架Storm簡(jiǎn)介 101
4.1.4 混合處理框架Spark簡(jiǎn)介 106
4.2 大數(shù)據(jù)存儲(chǔ)與管理 108
4.2.1 經(jīng)典數(shù)據(jù)存儲(chǔ)與管理技術(shù) 108
4.2.2 分布式大數(shù)據(jù)存儲(chǔ)與管理技術(shù) 110
4.2.3 分布式文件系統(tǒng)HDFS 112
4.2.4 分布式數(shù)據(jù)庫(kù)系統(tǒng)HBase 116
4.2.5 分布式數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)Hive 118
4.3 大數(shù)據(jù)分布式計(jì)算 121
4.3.1 分布式批處理框架Hadoop 121
4.3.2 分布式流處理框架Storm 125
4.3.3 分布式混合處理框架Spark 127
4.4 本章小結(jié) 131
4.5 習(xí)題 131
第5章 大數(shù)據(jù)分析與挖掘 133
5.1 引言 133
5.2 描述性數(shù)據(jù)分析 134
5.2.1 數(shù)據(jù)的集中趨勢(shì)度量 134
5.2.2 數(shù)據(jù)的離散趨勢(shì)度量 135
5.2.3 數(shù)據(jù)的偏態(tài)特性度量 137
5.2.4 使用Excel對(duì)數(shù)據(jù)進(jìn)行描述統(tǒng)計(jì) 138
5.3 回歸分析 139
5.3.1 一元線性回歸模型 139
5.3.2 其他類型的回歸模型 142
5.4 關(guān)聯(lián)分析的簡(jiǎn)介 144
5.4.1 “啤酒與尿布”的故事 144
5.4.2 常用的關(guān)聯(lián)分析算法 145
5.5 分類算法的簡(jiǎn)介 148
5.5.1 近鄰分類算法 149
5.5.2 決策樹算法 150
5.6 聚類算法的簡(jiǎn)介 151
5.6.1 主要的聚類算法類型 152
5.6.2 k均值聚類算法 153
5.6.3 層次聚類算法 154
5.7 分布式數(shù)據(jù)挖掘算法 156
5.8 數(shù)據(jù)挖掘技術(shù)的典型應(yīng)用 157
5.8.1 數(shù)據(jù)挖掘技術(shù)在生物信息學(xué)中的應(yīng)用 157
5.8.2 數(shù)據(jù)挖掘技術(shù)在市場(chǎng)營(yíng)銷領(lǐng)域中的應(yīng)用 158
5.8.3 數(shù)據(jù)挖掘技術(shù)在教育領(lǐng)域中的應(yīng)用 159
5.8.4 數(shù)據(jù)挖掘技術(shù)在金融領(lǐng)域中的應(yīng)用 159
5.9 本章小結(jié) 160
5.10 習(xí)題 160
第6章 大數(shù)據(jù)可視化 162
6.1 引言 162
6.1.1 什么是數(shù)據(jù)可視化 162
6.1.2 數(shù)據(jù)可視化的若干案例 163
6.1.3 數(shù)據(jù)可視化的作用 165
6.2 數(shù)據(jù)可視化的案例 165
6.2.1 數(shù)據(jù)集的簡(jiǎn)介 166
6.2.2 發(fā)展趨勢(shì)圖 166
6.2.3 人數(shù)分布圖 167
6.3 圖形元素和視覺通道 168
6.4 數(shù)據(jù)可視化的常用方法 172
6.4.1 趨勢(shì)型數(shù)據(jù)可視化方法 172
6.4.2 對(duì)比型數(shù)據(jù)可視化方法 174
6.4.3 比例型數(shù)據(jù)可視化方法 176
6.4.4 分布型數(shù)據(jù)可視化方法 178
6.4.5 文本數(shù)據(jù)可視化方法 180
6.4.6 關(guān)系網(wǎng)絡(luò)數(shù)據(jù)可視化方法 181
6.4.7 時(shí)空數(shù)據(jù)可視化方法 182
6.4.8 層次結(jié)構(gòu)數(shù)據(jù)可視化方法 183
6.4.9 高維數(shù)據(jù)可視化方法 184
6.5 數(shù)據(jù)可視化的常用工具和軟件的簡(jiǎn)介 185
6.5.1 FineBI數(shù)據(jù)可視化工具的簡(jiǎn)介 186
6.5.2 Tableau數(shù)據(jù)可視化工具的簡(jiǎn)介 190
6.5.3 Python的Matplotlib的簡(jiǎn)介 191
6.5.4 ECharts數(shù)據(jù)可視化編程庫(kù)的簡(jiǎn)介 193
6.6 本章小結(jié) 194
6.7 習(xí)題 195
第7章 大數(shù)據(jù)安全、開放與共享 196
7.1 大數(shù)據(jù)安全與隱私保護(hù) 196
7.1.1 大數(shù)據(jù)安全與隱私保護(hù)的概念 196
7.1.2 大數(shù)據(jù)安全與隱私保護(hù)的挑戰(zhàn) 198
7.1.3 大數(shù)據(jù)安全與隱私保護(hù)的策略 200
7.1.4 大數(shù)據(jù)信息安全技術(shù)的應(yīng)用 201
7.2 大數(shù)據(jù)生命周期中的安全與隱私 204
7.2.1 大數(shù)據(jù)采集與傳輸中的安全與隱私 204
7.2.2 大數(shù)據(jù)存儲(chǔ)中的安全與隱私 206
7.2.3 大數(shù)據(jù)分析與挖掘中的安全與隱私 207
7.3 大數(shù)據(jù)開放與共享 208
7.3.1 大數(shù)據(jù)開放與共享的概念 208
7.3.2 大數(shù)據(jù)開放與共享的類別關(guān)系 209
7.3.3 大數(shù)據(jù)開放與共享的挑戰(zhàn) 212
7.3.4 數(shù)據(jù)孤島問題 215
7.3.5 大數(shù)據(jù)開放與共享的措施 220
7.4 大數(shù)據(jù)安全的典型案例 222
7.4.1 大數(shù)據(jù)安全與隱私泄露的典型案例 222
7.4.2 大數(shù)據(jù)開放與共享的典型案例 224
7.4.3 大數(shù)據(jù)信息安全應(yīng)用的典型案例 225
7.5 本章小結(jié) 227
7.6 習(xí)題 227
第8章 大數(shù)據(jù)的行業(yè)應(yīng)用 229
8.1 互聯(lián)網(wǎng)大數(shù)據(jù)的應(yīng)用 229
8.1.1 互聯(lián)網(wǎng)大數(shù)據(jù)的簡(jiǎn)介 229
8.1.2 零售業(yè)互聯(lián)網(wǎng)大數(shù)據(jù)的應(yīng)用 232
8.1.3 房地產(chǎn)業(yè)互聯(lián)網(wǎng)大數(shù)據(jù)的應(yīng)用 233
8.1.4 餐飲業(yè)互聯(lián)網(wǎng)大數(shù)據(jù)的應(yīng)用 234
8.2 金融大數(shù)據(jù)的應(yīng)用 236
8.2.1 金融大數(shù)據(jù)的簡(jiǎn)介 236
8.2.2 銀行業(yè)金融大數(shù)據(jù)的應(yīng)用 239
8.2.3 證券業(yè)金融大數(shù)據(jù)的應(yīng)用 241
8.2.4 保險(xiǎn)業(yè)金融大數(shù)據(jù)的應(yīng)用 242
8.3 醫(yī)療大數(shù)據(jù)的應(yīng)用 244
8.3.1 醫(yī)療大數(shù)據(jù)的簡(jiǎn)介 244
8.3.2 臨床大數(shù)據(jù)的應(yīng)用 247
8.3.3 健康管理大數(shù)據(jù)的應(yīng)用 249
8.3.4 基因檢測(cè)大數(shù)據(jù)的應(yīng)用 251
8.4 工業(yè)大數(shù)據(jù)的應(yīng)用 252
8.4.1 工業(yè)大數(shù)據(jù)的簡(jiǎn)介 252
8.4.2 設(shè)備故障診斷與健康管理 255
8.4.3 生產(chǎn)質(zhì)量分析 258
8.4.4 生產(chǎn)效率優(yōu)化 259
8.5 智慧城市大數(shù)據(jù)的應(yīng)用 261
8.5.1 智慧城市大數(shù)據(jù)的簡(jiǎn)介 261
8.5.2 智慧政務(wù)大數(shù)據(jù) 264
8.5.3 智慧環(huán)境大數(shù)據(jù) 265
8.5.4 智慧教育大數(shù)據(jù) 268
8.6 本章小結(jié) 268
8.7 習(xí)題 269
參考文獻(xiàn) 271
大數(shù)據(jù)導(dǎo)論 作者簡(jiǎn)介
嚴(yán)宣輝,男,福建福州人,理學(xué)博士,福建師范大學(xué)計(jì)算機(jī)與網(wǎng)絡(luò)空間安全學(xué)院教授。數(shù)字福建環(huán)境監(jiān)測(cè)物聯(lián)網(wǎng)實(shí)驗(yàn)室副主任、福建省人工智能學(xué)會(huì)理事。主要從事機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘、計(jì)算智能方面的研究,在國(guó)內(nèi)外學(xué)術(shù)刊物上發(fā)表學(xué)術(shù)論文30余篇,主編與參編教材8部,主持完成省部級(jí)科研項(xiàng)目2項(xiàng),參與國(guó)家和省部級(jí)科研項(xiàng)目14項(xiàng)、教改項(xiàng)目6項(xiàng)。先后擔(dān)任過學(xué)院實(shí)驗(yàn)室主任和計(jì)算機(jī)科學(xué)系主任等工作。曾獲得福建省教學(xué)成果一等獎(jiǎng)1項(xiàng)、二等獎(jiǎng)1項(xiàng),校“福抗”教學(xué)獎(jiǎng)和“集英獎(jiǎng)教基金”教學(xué)獎(jiǎng)。
- >
有舍有得是人生
- >
史學(xué)評(píng)論
- >
山海經(jīng)
- >
朝聞道
- >
伊索寓言-世界文學(xué)名著典藏-全譯本
- >
龍榆生:詞曲概論/大家小書
- >
隨園食單
- >
巴金-再思錄