-
>
闖進數學世界――探秘歷史名題
-
>
中醫基礎理論
-
>
當代中國政府與政治(新編21世紀公共管理系列教材)
-
>
高校軍事課教程
-
>
思想道德與法治(2021年版)
-
>
毛澤東思想和中國特色社會主義理論體系概論(2021年版)
-
>
中醫內科學·全國中醫藥行業高等教育“十四五”規劃教材
大數據導論 版權信息
- ISBN:9787121488221
- 條形碼:9787121488221 ; 978-7-121-48822-1
- 裝幀:平塑
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
大數據導論 內容簡介
大數據導論課程旨在普及大數據知識,幫助學生理解大數據的概念及現實意義,掌握大數據的分析、處理和應用技術。本書圍繞大數據的基本概念和大數據處理的主要環節展開,共8章。第1章主要介紹大數據的概念和特征、價值和作用、相關的政策法規等;第2章主要介紹大數據相關技術,包括云計算、人工智能和物聯網;第3章主要介紹大數據采集與預處理的方法;第4章主要介紹大數據處理,包括3種主流的大數據處理框架(批處理框架Hadoop、流處理框架Storm 及混合處理框架Spark);第5章主要介紹大數據分析與挖掘的常用方法,包括數據的描述性分析方法、回歸分析方法、數據挖掘的典型算法(關聯分析算法、分類算法和聚類算法)及數據挖掘技術的典型應用等;第6章主要介紹大數據可視化的基礎知識和案例,以及常用的大數據可視化工具和軟件(FineBI、Matplotlib 和ECharts 等);第7章主要介紹大數據安全相關知識,包括大數據安全與隱私保護、大數據開放與共享,以及與大數據安全案例相關的政策法規;第8 章主要介紹大數據在互聯網、金融、醫療、工業和智慧城市方面的應用。本書主要面向高等學校大數據相關專業的學生,同時也適合對大數據技術感興趣的廣大讀者閱讀。
大數據導論 目錄
1.1 數據 1
1.1.1 數據的構成 2
1.1.2 數據的存儲容量單位 4
1.2 大數據的相關概念 4
1.2.1 大數據的概念 4
1.2.2 大數據的基本特征 5
1.3 大數據的意義、價值與作用 6
1.3.1 大數據的意義 7
1.3.2 大數據的價值 8
1.3.3 大數據的作用 9
1.4 大數據時代的新變革 10
1.4.1 大數據帶來的思維變革 10
1.4.2 大數據帶來的社會變革 12
1.5 大數據處理的主要環節 14
1.6 大數據的安全與共享 16
1.6.1 大數據的開放與共享 16
1.6.2 大數據安全與個人隱私保護 17
1.6.3 我國大數據相關的安全政策法規 18
1.7 大數據的發展現狀與發展趨勢 20
1.7.1 大數據的發展現狀 20
1.7.2 大數據的發展趨勢 24
1.7.3 大數據時代面臨的技術挑戰 26
1.8 本章小結 27
1.9 習題 27
第2章 大數據相關技術 29
2.1 云計算與大數據 29
2.1.1 云計算的基本概念 29
2.1.2 云計算的基本要素與優勢 31
2.1.3 云計算的體系架構 33
2.1.4 云計算的核心技術 36
2.1.5 云計算的發展現狀與主流平臺 38
2.1.6 云計算與大數據的關系 44
2.2 人工智能與大數據 44
2.2.1 人工智能的基本概念 45
2.2.2 人工智能的研究領域 47
2.2.3 人工智能的產業與應用 52
2.2.4 人工智能與大數據的關系 55
2.3 物聯網與大數據 56
2.3.1 物聯網的基本概念 57
2.3.2 物聯網的核心技術 59
2.3.3 物聯網的產業與應用 62
2.3.4 物聯網、云計算、人工智能與大數據的關系 65
2.4 本章小結 66
2.5 習題 66
第3章 大數據采集與預處理 68
3.1 認識數據 68
3.1.1 數據的屬性和類型 68
3.1.2 數據的量綱 69
3.2 大數據的來源和采集途徑 70
3.2.1 大數據的來源 70
3.2.2 大數據的采集途徑 70
3.3 常用的大數據采集工具 72
3.3.1 爬山虎采集器 72
3.3.2 八爪魚采集器 74
3.3.3 基于Python的網頁抓取框架Scrapy 75
3.3.4 日志采集工具Flume 76
3.3.5 分布式消息服務工具Kafka 78
3.4 數據預處理 79
3.4.1 數據清洗 79
3.4.2 數據集成 83
3.4.3 數據變換 84
3.4.4 數據歸約 88
3.5 使用OpenRefine對數據進行預處理 88
3.6 本章小結 93
3.7 習題 93
第4章 大數據處理 95
4.1 大數據處理框架 95
4.1.1 主流大數據處理框架的簡介 95
4.1.2 批處理框架Hadoop簡介 98
4.1.3 流處理框架Storm簡介 101
4.1.4 混合處理框架Spark簡介 106
4.2 大數據存儲與管理 108
4.2.1 經典數據存儲與管理技術 108
4.2.2 分布式大數據存儲與管理技術 110
4.2.3 分布式文件系統HDFS 112
4.2.4 分布式數據庫系統HBase 116
4.2.5 分布式數據倉庫系統Hive 118
4.3 大數據分布式計算 121
4.3.1 分布式批處理框架Hadoop 121
4.3.2 分布式流處理框架Storm 125
4.3.3 分布式混合處理框架Spark 127
4.4 本章小結 131
4.5 習題 131
第5章 大數據分析與挖掘 133
5.1 引言 133
5.2 描述性數據分析 134
5.2.1 數據的集中趨勢度量 134
5.2.2 數據的離散趨勢度量 135
5.2.3 數據的偏態特性度量 137
5.2.4 使用Excel對數據進行描述統計 138
5.3 回歸分析 139
5.3.1 一元線性回歸模型 139
5.3.2 其他類型的回歸模型 142
5.4 關聯分析的簡介 144
5.4.1 “啤酒與尿布”的故事 144
5.4.2 常用的關聯分析算法 145
5.5 分類算法的簡介 148
5.5.1 近鄰分類算法 149
5.5.2 決策樹算法 150
5.6 聚類算法的簡介 151
5.6.1 主要的聚類算法類型 152
5.6.2 k均值聚類算法 153
5.6.3 層次聚類算法 154
5.7 分布式數據挖掘算法 156
5.8 數據挖掘技術的典型應用 157
5.8.1 數據挖掘技術在生物信息學中的應用 157
5.8.2 數據挖掘技術在市場營銷領域中的應用 158
5.8.3 數據挖掘技術在教育領域中的應用 159
5.8.4 數據挖掘技術在金融領域中的應用 159
5.9 本章小結 160
5.10 習題 160
第6章 大數據可視化 162
6.1 引言 162
6.1.1 什么是數據可視化 162
6.1.2 數據可視化的若干案例 163
6.1.3 數據可視化的作用 165
6.2 數據可視化的案例 165
6.2.1 數據集的簡介 166
6.2.2 發展趨勢圖 166
6.2.3 人數分布圖 167
6.3 圖形元素和視覺通道 168
6.4 數據可視化的常用方法 172
6.4.1 趨勢型數據可視化方法 172
6.4.2 對比型數據可視化方法 174
6.4.3 比例型數據可視化方法 176
6.4.4 分布型數據可視化方法 178
6.4.5 文本數據可視化方法 180
6.4.6 關系網絡數據可視化方法 181
6.4.7 時空數據可視化方法 182
6.4.8 層次結構數據可視化方法 183
6.4.9 高維數據可視化方法 184
6.5 數據可視化的常用工具和軟件的簡介 185
6.5.1 FineBI數據可視化工具的簡介 186
6.5.2 Tableau數據可視化工具的簡介 190
6.5.3 Python的Matplotlib的簡介 191
6.5.4 ECharts數據可視化編程庫的簡介 193
6.6 本章小結 194
6.7 習題 195
第7章 大數據安全、開放與共享 196
7.1 大數據安全與隱私保護 196
7.1.1 大數據安全與隱私保護的概念 196
7.1.2 大數據安全與隱私保護的挑戰 198
7.1.3 大數據安全與隱私保護的策略 200
7.1.4 大數據信息安全技術的應用 201
7.2 大數據生命周期中的安全與隱私 204
7.2.1 大數據采集與傳輸中的安全與隱私 204
7.2.2 大數據存儲中的安全與隱私 206
7.2.3 大數據分析與挖掘中的安全與隱私 207
7.3 大數據開放與共享 208
7.3.1 大數據開放與共享的概念 208
7.3.2 大數據開放與共享的類別關系 209
7.3.3 大數據開放與共享的挑戰 212
7.3.4 數據孤島問題 215
7.3.5 大數據開放與共享的措施 220
7.4 大數據安全的典型案例 222
7.4.1 大數據安全與隱私泄露的典型案例 222
7.4.2 大數據開放與共享的典型案例 224
7.4.3 大數據信息安全應用的典型案例 225
7.5 本章小結 227
7.6 習題 227
第8章 大數據的行業應用 229
8.1 互聯網大數據的應用 229
8.1.1 互聯網大數據的簡介 229
8.1.2 零售業互聯網大數據的應用 232
8.1.3 房地產業互聯網大數據的應用 233
8.1.4 餐飲業互聯網大數據的應用 234
8.2 金融大數據的應用 236
8.2.1 金融大數據的簡介 236
8.2.2 銀行業金融大數據的應用 239
8.2.3 證券業金融大數據的應用 241
8.2.4 保險業金融大數據的應用 242
8.3 醫療大數據的應用 244
8.3.1 醫療大數據的簡介 244
8.3.2 臨床大數據的應用 247
8.3.3 健康管理大數據的應用 249
8.3.4 基因檢測大數據的應用 251
8.4 工業大數據的應用 252
8.4.1 工業大數據的簡介 252
8.4.2 設備故障診斷與健康管理 255
8.4.3 生產質量分析 258
8.4.4 生產效率優化 259
8.5 智慧城市大數據的應用 261
8.5.1 智慧城市大數據的簡介 261
8.5.2 智慧政務大數據 264
8.5.3 智慧環境大數據 265
8.5.4 智慧教育大數據 268
8.6 本章小結 268
8.7 習題 269
參考文獻 271
大數據導論 作者簡介
嚴宣輝,男,福建福州人,理學博士,福建師范大學計算機與網絡空間安全學院教授。數字福建環境監測物聯網實驗室副主任、福建省人工智能學會理事。主要從事機器學習和數據挖掘、計算智能方面的研究,在國內外學術刊物上發表學術論文30余篇,主編與參編教材8部,主持完成省部級科研項目2項,參與國家和省部級科研項目14項、教改項目6項。先后擔任過學院實驗室主任和計算機科學系主任等工作。曾獲得福建省教學成果一等獎1項、二等獎1項,校“福抗”教學獎和“集英獎教基金”教學獎。
- >
人文閱讀與收藏·良友文學叢書:一天的工作
- >
隨園食單
- >
【精裝繪本】畫給孩子的中國神話
- >
煙與鏡
- >
史學評論
- >
我與地壇
- >
姑媽的寶刀
- >
回憶愛瑪儂