掃一掃
關注中圖網
官方微博
本類五星書更多>
-
>
闖進數(shù)學世界――探秘歷史名題
-
>
中醫(yī)基礎理論
-
>
當代中國政府與政治(新編21世紀公共管理系列教材)
-
>
高校軍事課教程
-
>
思想道德與法治(2021年版)
-
>
毛澤東思想和中國特色社會主義理論體系概論(2021年版)
-
>
中醫(yī)內科學·全國中醫(yī)藥行業(yè)高等教育“十四五”規(guī)劃教材
大數(shù)據技術導論 版權信息
- ISBN:9787560659787
- 條形碼:9787560659787 ; 978-7-5606-5978-7
- 裝幀:一般膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>
大數(shù)據技術導論 內容簡介
本書旨在指導高職院校學生對大數(shù)據技術進行入門學習,以任務驅動為導向,系統(tǒng)介紹了大數(shù)據技術基礎知識及應用案例。全書共分為六大項目,具體包括大數(shù)據與大數(shù)據時代、大數(shù)據處理平臺、Hadoop開發(fā)環(huán)境的搭建、數(shù)據采集與預處理、數(shù)據計算與數(shù)據存儲、數(shù)據分析與可視化。 本書可作為高職院校大數(shù)據應用技術、軟件技術等專業(yè)學生的專業(yè)基礎課教材,也可作為其他計算機相關專業(yè)學生的選修課程教材以及大數(shù)據技術愛好者的自學參考書。
大數(shù)據技術導論 目錄
項目一 大數(shù)據與大數(shù)據時代 1
任務1-1 認識大數(shù)據時代 2
1.1.1 大數(shù)據時代 3
1.1.2 大數(shù)據時代到來的原因 3
1.1.3 大數(shù)據時代產生的變革 7
任務1-2 掌握大數(shù)據基本特征和處理流程 12
1.2.1 數(shù)據的定義和分類 13
1.2.2 大數(shù)據的定義 13
1.2.3 大數(shù)據的特征 13
1.2.4 大數(shù)據處理流程 15
任務1-3 大數(shù)據技術的發(fā)展歷程 16
任務1-4 大數(shù)據產業(yè)結構及行業(yè)應用 18
1.4.1 大數(shù)據產業(yè)結構 18
1.4.2 大數(shù)據、云計算、人工智能、物聯(lián)網的深度融合 24
1.4.3 大數(shù)據技術在各行業(yè)領域的應用案例 26
任務1-5 了解大數(shù)據行業(yè)的崗位需求 39
1.5.1 大數(shù)據行業(yè)的崗位需求 39
1.5.2 高職院校學生在大數(shù)據行業(yè)的就業(yè)定位 41
小結 42
課后習題 43
項目二 大數(shù)據處理平臺 44
任務2-1 構建大數(shù)據處理平臺的原因 46
2.1.1 大數(shù)據時代的數(shù)據類型 46
2.1.2 傳統(tǒng)數(shù)據處理平臺遇到的問題 48
2.1.3 大數(shù)據處理平臺 49
任務2-2 *早的大數(shù)據生態(tài)系統(tǒng)—Hadoop 50
2.2.1 Hadoop的簡介和發(fā)展 50
2.2.2 Hadoop的設計思想和特點 53
2.2.3 Hadoop的兩大基礎組件 54
2.2.4 Hadoop生態(tài)系統(tǒng)的架構和其他組件 57
任務2-3 大數(shù)據處理平臺架構 61
2.3.1 大數(shù)據計算模式 61
2.3.2 大數(shù)據處理平臺的基本架構及數(shù)據處理流程 62
2.3.3 主流大數(shù)據處理平臺的架構 63
2.3.4 大數(shù)據處理平臺架構案例介紹 67
小結 73
課后習題 73
項目三 Hadoop開發(fā)環(huán)境的搭建 74
任務3-1 VMware虛擬機的安裝 76
任務3-2 VMware上Ubuntu系統(tǒng)的安裝和配置 80
3.2.1 Ubuntu系統(tǒng)的安裝 80
3.2.2 Ubuntu系統(tǒng)的網絡設置 89
任務3-3 Ubuntu系統(tǒng)上Hadoop的安裝和配置 95
3.3.1 Java環(huán)境的安裝和配置 96
3.3.2 SSH的安裝以及免密碼登錄的設置 97
3.3.3 Hadoop的安裝和配置 99
任務3-4 Hadoop下的詞頻統(tǒng)計 105
小結 108
課后習題 108
項目四 數(shù)據采集與預處理 109
任務4-1 數(shù)據采集初識 111
4.1.1 傳統(tǒng)數(shù)據采集和大數(shù)據采集 112
4.1.2 大數(shù)據采集方式 114
4.1.3 大數(shù)據采集工具 116
4.1.4 數(shù)據預處理 121
任務4-2 互聯(lián)網數(shù)據采集 122
4.2.1 爬蟲 122
4.2.2 爬蟲編程語言及爬蟲分類 123
任務4-3 Windows下Python爬蟲開發(fā)環(huán)境的搭建 126
4.3.1 Windows下Python3.x的安裝和環(huán)境變量的配置 126
4.3.2 requests和Beautiful Soup包的安裝 129
4.3.3 PyCharm的安裝和使用 130
任務4-4 Python爬蟲應用程序的編寫 134
4.4.1 爬蟲爬取數(shù)據的過程 134
4.4.2 網頁的基本結構 134
4.4.3 網站數(shù)據的抓取 135
4.4.4 網站數(shù)據的解析與數(shù)據清洗 139
4.4.5 數(shù)據的爬取與預處理 142
小結 150
課后習題 151
項目五 數(shù)據計算與數(shù)據存儲 152
任務5-1 大數(shù)據計算框架初識 154
5.1.1 大數(shù)據計算和傳統(tǒng)數(shù)據計算的區(qū)別 155
5.1.2 常見的大數(shù)據計算框架簡介 157
任務5-2 大數(shù)據存儲初識 165
5.2.1 分布式文件系統(tǒng) 166
5.2.2 NoSQL數(shù)據庫簡介 167
5.2.3 HBase簡介 168
任務5-3 Spark和HBase開發(fā)環(huán)境的搭建 171
5.3.1 HBase的安裝和配置 171
5.3.2 Spark的安裝和配置 175
任務5-4 Spark應用程序的編寫 179
5.4.1 Linux下Scala IDE For Eclipse工具的安裝和配置 179
5.4.2 Spark應用程序的編寫及打包 182
5.4.3 Spark應用程序jar包的提交 200
小結 202
課后習題 202
項目六 數(shù)據分析與可視化 203
任務6-1 大數(shù)據分析初識 206
6.1.1 大數(shù)據分析簡介 207
6.1.2 Python大數(shù)據分析環(huán)境的搭建 209
6.1.3 常見的大數(shù)據分析方法 218
任務6-2 大數(shù)據可視化初識 231
6.2.1 大數(shù)據可視化的概念 231
6.2.2 常用的數(shù)據可視化工具 236
任務6-3 房屋數(shù)據分析可視化案例編程 239
6.3.1 PySpark的配置和使用 239
6.3.2 Spark應用程序的編寫 241
小結 250
課后習題 250
參考文獻 251
展開全部
書友推薦
- >
自卑與超越
- >
伯納黛特,你要去哪(2021新版)
- >
龍榆生:詞曲概論/大家小書
- >
詩經-先民的歌唱
- >
唐代進士錄
- >
大紅狗在馬戲團-大紅狗克里弗-助人
- >
隨園食單
- >
小考拉的故事-套裝共3冊
本類暢銷