中图网(原中国图书网):网上书店,中文字幕在线一区二区三区,尾货特色书店,中文字幕在线一区,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
大數(shù)據(jù)導論/思維,技術與應用

包郵 大數(shù)據(jù)導論/思維,技術與應用

作者:武志學
出版社:人民郵電出版社出版時間:2018-08-01
開本: 其他 頁數(shù): 244
中 圖 價:¥41.8(8.4折) 定價  ¥49.8 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

大數(shù)據(jù)導論/思維,技術與應用 版權信息

  • ISBN:9787115504852
  • 條形碼:9787115504852 ; 978-7-115-50485-2
  • 裝幀:一般膠版紙
  • 冊數(shù):暫無
  • 重量:暫無
  • 所屬分類:>

大數(shù)據(jù)導論/思維,技術與應用 本書特色

本書將基本概念與實例相結合,由淺入深、循序漸進地對大數(shù)據(jù)思維、技術和應用做了全面系統(tǒng)的介紹。全書共12章,分為大數(shù)據(jù)基礎篇、大數(shù)據(jù)存儲篇、大數(shù)據(jù)處理篇、大數(shù)據(jù)挖掘篇和大數(shù)據(jù)應用篇。 大數(shù)據(jù)基礎篇的內容涵蓋了大數(shù)據(jù)思維理念、大數(shù)據(jù)的產生與作用、大數(shù)據(jù)基本概念、大數(shù)據(jù)采集工具Flume和Scribe、大數(shù)據(jù)爬蟲工具Nutch和Scapy、大數(shù)據(jù)預處理工具Kettle、大數(shù)據(jù)處理架構Hadoop;大數(shù)據(jù)存儲篇的內容包含分布式文件存儲系統(tǒng)HDFS、海量數(shù)據(jù)存儲數(shù)據(jù)庫系統(tǒng)HBase和海量數(shù)據(jù)倉庫系統(tǒng)Hive;大數(shù)據(jù)處理篇主要介紹了分布式并發(fā)計算批處理模式MapReduce,基于內存的快速處理模式Spark,以及基于實時數(shù)據(jù)流的實時處理模式Spark Streaming;大數(shù)據(jù)挖掘篇主要對分類、預測、聚類和關聯(lián)等各類大數(shù)據(jù)挖掘算法的原理和使用場景進行了描述,并使用Spark MLlib提供的機器學習算法進行了實例講解;大數(shù)據(jù)應用篇分別從大數(shù)據(jù)場景應用的橫向和縱向出發(fā),介紹了大數(shù)據(jù)在各個功能領域的應用場景和在各個行業(yè)的應用場景。

大數(shù)據(jù)導論/思維,技術與應用 內容簡介

本書將基本概念與實例相結合,由淺入深、循序漸進地對大數(shù)據(jù)思維、技術和應用做了全面系統(tǒng)的介紹。全書共12章,分為大數(shù)據(jù)基礎篇、大數(shù)據(jù)存儲篇、大數(shù)據(jù)處理篇、大數(shù)據(jù)挖掘篇和大數(shù)據(jù)應用篇。 大數(shù)據(jù)基礎篇的內容涵蓋了大數(shù)據(jù)思維理念、大數(shù)據(jù)的產生與作用、大數(shù)據(jù)基本概念、大數(shù)據(jù)采集工具Flume和Scribe、大數(shù)據(jù)爬蟲工具Nutch和Scapy、大數(shù)據(jù)預處理工具Kettle、大數(shù)據(jù)處理架構Hadoop;大數(shù)據(jù)存儲篇的內容包含分布式文件存儲系統(tǒng)HDFS、海量數(shù)據(jù)存儲數(shù)據(jù)庫系統(tǒng)HBase和海量數(shù)據(jù)倉庫系統(tǒng)Hive;大數(shù)據(jù)處理篇主要介紹了分布式并發(fā)計算批處理模式MapReduce,基于內存的快速處理模式Spark,以及基于實時數(shù)據(jù)流的實時處理模式Spark Streaming;大數(shù)據(jù)挖掘篇主要對分類、預測、聚類和關聯(lián)等各類大數(shù)據(jù)挖掘算法的原理和使用場景進行了描述,并使用Spark MLlib提供的機器學習算法進行了實例講解;大數(shù)據(jù)應用篇分別從大數(shù)據(jù)場景應用的橫向和縱向出發(fā),介紹了大數(shù)據(jù)在各個功能領域的應用場景和在各個行業(yè)的應用場景。

大數(shù)據(jù)導論/思維,技術與應用 目錄

第 一部分 大數(shù)據(jù)基礎篇

第 1章 大數(shù)據(jù)思維 2

1.1 什么是大數(shù)據(jù) 2

1.2 從IT時代到大數(shù)據(jù)時代 4

1.3 大數(shù)據(jù)的產生與作用 5

1.3.1 大數(shù)據(jù)的產生 6

1.3.2 大數(shù)據(jù)的作用 6

1.4 大數(shù)據(jù)時代的新理念 7

1.4.1 對研究范式的新認識:從第三范式到第四范式 7

1.4.2 對數(shù)據(jù)重要性的新認識:從數(shù)據(jù)資源到數(shù)據(jù)資產 8

1.4.3 對方法論的新認識:從基于知識到基于數(shù)據(jù) 9

1.4.4 對數(shù)據(jù)分析的新認識:從統(tǒng)計學到數(shù)據(jù)科學 9

1.4.5 對計算智能的新認識:從復雜算法到簡單算法 10

1.4.6 對管理目標的新認識:從業(yè)務數(shù)據(jù)化到數(shù)據(jù)業(yè)務化 11

1.4.7 對決策方式的新認識:從目標驅動型到數(shù)據(jù)驅動型 12

1.4.8 對產業(yè)競合關系的新認識:從以戰(zhàn)略為中心到以數(shù)據(jù)為中心 12

1.4.9 對數(shù)據(jù)復雜性的新認識:從不接受到接受數(shù)據(jù)的復雜性 13

1.4.10 對數(shù)據(jù)處理模式的新認識:從小眾參與到大眾協(xié)同 14

1.5 總結 14

習題 14

第 2章 大數(shù)據(jù)技術概述 15

2.1 大數(shù)據(jù)處理的基本流程 15

2.1.1 數(shù)據(jù)抽取與集成 16

2.1.2 數(shù)據(jù)分析 16

2.1.3 數(shù)據(jù)解釋 16

2.2 大數(shù)據(jù)關鍵技術 17

2.2.1 大數(shù)據(jù)采集技術 17

2.2.2 大數(shù)據(jù)預處理技術 17

2.2.3 大數(shù)據(jù)存儲及管理技術 18

2.2.4 大數(shù)據(jù)處理 19

2.2.5 大數(shù)據(jù)分析及挖掘技術 19

2.2.6 大數(shù)據(jù)展示技術 20

2.3 總結 21

習題 21

第3章 大數(shù)據(jù)采集 22

3.1 大數(shù)據(jù)采集概述 22

3.1.1 大數(shù)據(jù)分類 22

3.1.2 大數(shù)據(jù)采集方法分類 23

3.2 系統(tǒng)日志采集方法 24

3.2.1 Flume的基本概念 24

3.2.2 Flume使用方法 25

3.2.3 Flume應用案例 26

3.3 網絡數(shù)據(jù)采集方法 27

3.3.1 網絡爬蟲原理 27

3.3.2 網絡爬蟲工作流程 28

3.3.3 網絡爬蟲抓取策略 28

3.3.4 Scrapy網絡爬蟲系統(tǒng) 32

3.3.5 小結 36

3.4 總結 36

習題 36

第4章 大數(shù)據(jù)預處理 37

4.1 大數(shù)據(jù)預處理概述 37

4.1.1 大數(shù)據(jù)預處理整體架構 37

4.1.2 數(shù)據(jù)質量問題分類 38

4.1.3 大數(shù)據(jù)預處理方法 38

4.2 數(shù)據(jù)清洗 39

4.2.1 遺漏數(shù)據(jù)處理 40

4.2.2 噪聲數(shù)據(jù)處理 40

4.2.3 不一致數(shù)據(jù)處理 42

4.3 數(shù)據(jù)集成 42

4.4 數(shù)據(jù)轉換 42

4.5 數(shù)據(jù)消減 44

4.5.1 數(shù)據(jù)立方合計 44

4.5.2 維數(shù)消減 44

4.5.3 數(shù)據(jù)壓縮 45

4.5.4 數(shù)據(jù)塊消減 46

4.6 離散化和概念層次樹 48

4.6.1 數(shù)值概念層次樹 48

4.6.2 類別概念層次樹 49

4.7 ETL工具Kettle 50

4.7.1 ETL工具簡介 51

4.7.2 安裝Kettle 51

4.7.3 Kettle的數(shù)據(jù)流處理 52

4.8 總結 55

習題 56

第5章 大數(shù)據(jù)處理系統(tǒng) 57

5.1 大數(shù)據(jù)技術概述 57

5.1.1 分布式計算 57

5.1.2 服務器集群 57

5.1.3 大數(shù)據(jù)的技術基礎 57

5.2 Google大數(shù)據(jù)處理系統(tǒng) 58

5.2.1 GFS 58

5.2.2 MapReduce 60

5.2.3 BigTable 60

5.3 Hadoop大數(shù)據(jù)處理系統(tǒng) 61

5.3.1 Hadoop系統(tǒng)簡介 61

5.3.2 Hadoop生態(tài)圈 61

5.3.3 Hadoop版本演進 63

5.3.4 Hadoop發(fā)行版本 63

5.4 總結 64

習題 64

第二部分 大數(shù)據(jù)存儲篇

第6章 大數(shù)據(jù)文件系統(tǒng)HDFS 66

6.1 HDFS簡介 66

6.2 HDFS基本原理 66

6.2.1 文件系統(tǒng)的問題 67

6.2.2 HDFS的基本思想 67

6.2.3 HDFS的設計理念 68

6.2.4 HDFS的局限 69

6.3 HDFS系統(tǒng)實現(xiàn) 69

6.3.1 HDFS整體架構 69

6.3.2 HDFS數(shù)據(jù)復制 70

6.4 HDFS數(shù)據(jù)訪問機制 71

6.4.1 讀取流程 71

6.4.2 寫入流程 72

6.5 HDFS操作 73

6.5.1 HDFS常用命令 73

6.5.2 HDFS的Web界面 74

6.5.3 HDFS的Java API 76

6.6 總結 78

習題 79

第7章 NOSQL數(shù)據(jù)庫HBASE 80

7.1 NoSQL概述 80

7.1.1 NoSQL的起因 80

7.1.2 NoSQL的特點 81

7.1.3 NoSQL數(shù)據(jù)庫面臨的挑戰(zhàn) 82

7.1.4 NoSQL的類型 82

7.2 HBase概述 86

7.3 HBase數(shù)據(jù)模型 87

7.3.1 數(shù)據(jù)模型概述 87

7.3.2 數(shù)據(jù)模型的基本概念 88

7.3.3 概念視圖 88

7.3.4 物理視圖 89

7.4 HBase命令行 90

7.4.1 一般操作 90

7.4.2 DDL操作 90

7.4.3 DML操作 91

7.4.4 HBase表實例 93

7.5 HBase的運行機制 94

7.5.1 HBase的物理存儲 94

7.5.2 HBase的邏輯架構 95

7.6 HBase的編程 96

7.6.1 HBase的常用Java API 96

7.6.2 HBase編程實例 98

7.7 總結 101

習題 101

第三部分 大數(shù)據(jù)處理篇

第8章 大數(shù)據(jù)批處理 HADOOP MAPREDUCE 103

8.1 MapReduce概述 103

8.1.1 批處理模式 103

8.1.2 MapReduce簡釋 104

8.1.3 MapReduce基本思想 105

8.1.4 Map函數(shù)和Reduce函數(shù) 107

8.2 Hadoop MapReduce架構 109

8.3 Hadoop MapReduce的工作流程 110

8.4 實例分析:單詞計數(shù) 112

8.4.1 設計思路 112

8.4.2 處理過程 112

8.5 Hadoop MapReduce 的工作機制 113

8.5.1 Hadoop MapReduce作業(yè)執(zhí)行流程 114

8.5.2 Hadoop MapReduce的Shuffle階段 115

8.5.3 Hadoop MapReduce的主要特點 117

8.6 Hadoop MapReduce編程實戰(zhàn) 118

8.6.1 任務準備 118

8.6.2 編寫Map程序 118

8.6.3 編寫Reduce程序 119

8.6.4 編寫main函數(shù) 121

8.6.5 核心代碼包 121

8.6.6 運行代碼 122

8.7 總結 122

習題 122

第9章 大數(shù)據(jù)快速處理SPARK 124

9.1 Spark簡介 124

9.1.1 Spark與Hadoop 124

9.1.2 Spark的適用場景 126

9.2 RDD概念 126

9.2.1 RDD的基本概念 126

9.2.2 RDD基本操作 127

9.2.3 RDD血緣關系 130

9.2.4 RDD依賴類型 130

9.2.5 階段劃分 131

9.2.6 RDD緩存 132

9.3 Spark運行架構和機制 133

9.3.1 Spark總體架構 133

9.3.2 Spark運行流程 134

9.4 Spark生態(tài)系統(tǒng) 135

9.5 Spark編程實踐 137

9.5.1 啟動Spark Shell 137

9.5.2 Spark Shell使用 137

9.5.3 編寫Java應用程序 138

9.6 總結 140

習題 140

第 10章 大數(shù)據(jù)實時流計算SPARK STREAMING 143

10.1 Spark Streaming簡介 143

10.2 Spark Streaming的系統(tǒng)架構 144

10.2.1 傳統(tǒng)流處理系統(tǒng)架構 144

10.2.2 Spark Streaming系統(tǒng)架構 145

10.2.3 動態(tài)負載均衡 146

10.2.4 容錯性 147

10.2.5 實時性、擴展性與吞吐量 148

10.3 編程模型 149

10.3.1 DStream的操作流程 149

10.3.2 Spark Streaming使用 149

10.3.3 DStream的輸入源 150

10.4 DStream的操作 151

10.4.1 普通的轉換操作 151

10.4.2 窗口轉換操作 153

10.4.3 輸出操作 154

10.4.4 持久化 155

10.5 編程實戰(zhàn) 155

10.5.1 流數(shù)據(jù)模擬器 155

10.5.2 實例1:讀取文件演示 156

10.5.3 實例2:網絡數(shù)據(jù)演示 157

10.5.4 實例3:Stateful演示 158

10.5.5 實例4:窗口演示 159

10.6 總結 160

習題 161

第四部分 大數(shù)據(jù)挖掘篇

第 11章 大數(shù)據(jù)挖掘 16311.1 數(shù)據(jù)挖掘概述 163

11.1.1 什么是數(shù)據(jù)挖掘 163

11.1.2 數(shù)據(jù)挖掘的價值類型 164

11.1.3 數(shù)據(jù)挖掘算法的類型 165

11.2 Spark MLlib簡介 166

11.2.1 Spark MLlib的構成 166

11.2.2 Spark MLlib的優(yōu)勢 166

11.3 分類和預測 166

11.3.1 分類的基本概念 167

11.3.2 預測的基本概念 168

11.3.3 決策樹算法 168

11.3.4 樸素貝葉斯算法 172

11.3.5 回歸分析 175

11.3.6 小結 180

11.4 聚類分析 180

11.4.1 基本概念 180

11.4.2 聚類分析方法的類別 181

11.4.3 k-means聚類算法 184

11.4.4 DBSCAN聚類算法 187

11.4.5 小結 190

11.5 關聯(lián)分析 191

11.5.1 概述 191

11.5.2 基本概念 191

11.5.3 關聯(lián)分析步驟 192

11.5.4 Apriori關聯(lián)分析算法 193

11.5.5 FP-Tree關聯(lián)分析算法 194

11.5.6 小結 199

11.6 總結 200

習題 200

第五部分 大數(shù)據(jù)應用篇

第 12章 大數(shù)據(jù)應用 205

12.1 大數(shù)據(jù)功能應用 205

12.1.1 基于大數(shù)據(jù)的精準營銷 205

12.1.2 基于大數(shù)據(jù)的個性化推薦 208

12.1.3 大數(shù)據(jù)預測 215

12.1.4 大數(shù)據(jù)的其他應用領域 219

12.1.5 小結 221

12.2 大數(shù)據(jù)行業(yè)應用 221

12.2.1 大數(shù)據(jù)行業(yè)應用概述 221

12.2.2 金融行業(yè)大數(shù)據(jù) 222

12.2.3 互聯(lián)網行業(yè)的大數(shù)據(jù)應用 229

12.2.4 物流行業(yè)大數(shù)據(jù)應用 235

12.2.5 小結 242

12.3 總結 243

習題 243

展開全部

大數(shù)據(jù)導論/思維,技術與應用 作者簡介

武志學,劍橋大學博士,曾任思杰(Citrix)公司主任研究員、成都國騰實業(yè)集團CTO、電子科技大學成都學院云計算科學與技術系第一任系主任。現(xiàn)任洛陽汽車工業(yè)大學副校長兼人工智能學院院長、成都信息工程大學大數(shù)據(jù)與安全工程中心主任、成都鼎晟數(shù)智科技有限公司董事長。兼任四川省云計算產業(yè)聯(lián)盟副主任、四川省高性能計算專家委員會副主任委員、成都市軟件行業(yè)協(xié)會專家委員會委員。 云計算開源平臺OpenStack頂層設計者之一,發(fā)表國際會議和期刊論文20多篇 ,獲得相關專利20余項,編寫云計算、大數(shù)據(jù)圖書4部,大數(shù)據(jù)在線培訓平臺“志學課堂” 發(fā)起人。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 液压油缸-液压站生产厂家-洛阳泰诺液压科技有限公司 | 异噻唑啉酮-均三嗪-三丹油-1227-中北杀菌剂厂家 | 昆明挖掘机修理厂_挖掘机翻新再制造-昆明聚力工程机械维修有限公司 | 搜木网 - 木业全产业链交易平台,免费搜货、低价买货! | 雷达液位计_超声波风速风向仪_雨量传感器_辐射传感器-山东风途物联网 | 股票入门基础知识_股票知识_股票投资大师_格雷厄姆网 | 10吨无线拉力计-2吨拉力计价格-上海佳宜电子科技有限公司 | 篮球地板厂家_舞台木地板品牌_体育运动地板厂家_凯洁地板 | 浙江自考_浙江自学考试网| 选矿设备,选矿生产线,选矿工艺,选矿技术-昆明昆重矿山机械 | Magnescale探规,Magnescale磁栅尺,Magnescale传感器,Magnescale测厚仪,Mitutoyo光栅尺,笔式位移传感器-苏州连达精密量仪有限公司 | 郑州大巴车出租|中巴车租赁|旅游大巴租车|包车|郑州旅游大巴车租赁有限公司 | 富森高压水枪-柴油驱动-养殖场高压清洗机-山东龙腾环保科技有限公司 | 青岛美佳乐清洁工程有限公司|青岛油烟管道清洗|酒店|企事业单位|学校工厂厨房|青岛油烟管道清洗 插针变压器-家用电器变压器-工业空调变压器-CD型电抗器-余姚市中驰电器有限公司 | 户外环保不锈钢垃圾桶_标识标牌制作_园林公园椅厂家_花箱定制-北京汇众环艺 | 英国公司注册-新加坡公司注册-香港公司开户-离岸公司账户-杭州商标注册-杭州优创企业 | 安徽成考网-安徽成人高考网| 平面钻,法兰钻,三维钻-山东兴田阳光智能装备股份有限公司 | Eiafans.com_环评爱好者 环评网|环评论坛|环评报告公示网|竣工环保验收公示网|环保验收报告公示网|环保自主验收公示|环评公示网|环保公示网|注册环评工程师|环境影响评价|环评师|规划环评|环评报告|环评考试网|环评论坛 - Powered by Discuz! | DDoS安全防护官网-领先的DDoS安全防护服务商 | 应急灯_消防应急灯_应急照明灯_应急灯厂家-大成智慧官网 | 二手电脑回收_二手打印机回收_二手复印机回_硒鼓墨盒回收-广州益美二手电脑回收公司 | 钢结构-钢结构厂房-钢结构工程[江苏海逵钢构厂] | 列管冷凝器,刮板蒸发器,外盘管反应釜厂家-无锡曼旺化工设备有限公司 | 蒸汽热收缩机_蒸汽发生器_塑封机_包膜机_封切收缩机_热收缩包装机_真空机_全自动打包机_捆扎机_封箱机-东莞市中堡智能科技有限公司 | 拉伸膜,PE缠绕膜,打包带,封箱胶带,包装膜厂家-东莞宏展包装 | 陕西安玻璃自动感应门-自动重叠门-磁悬浮平开门厂家【捷申达门业】 | WF2户外三防照明配电箱-BXD8050防爆防腐配电箱-浙江沃川防爆电气有限公司 | 环保袋,无纺布袋,无纺布打孔袋,保温袋,环保袋定制,环保袋厂家,环雅包装-十七年环保袋定制厂家 | 我爱古诗词_古诗词名句赏析学习平台 | 专注氟塑料泵_衬氟泵_磁力泵_卧龙泵阀_化工泵专业品牌 - 梭川泵阀 | 干法制粒机_智能干法制粒机_张家港市开创机械制造有限公司 | 富森高压水枪-柴油驱动-养殖场高压清洗机-山东龙腾环保科技有限公司 | 小型高低温循环试验箱-可程式高低温湿热交变试验箱-东莞市拓德环境测试设备有限公司 | 中央空调维修、中央空调保养、螺杆压缩机维修-苏州东菱空调 | 标准件-非标紧固件-不锈钢螺栓-非标不锈钢螺丝-非标螺母厂家-三角牙锁紧自攻-南京宝宇标准件有限公司 | 印刷人才网 印刷、包装、造纸,中国80%的印刷企业人才招聘选印刷人才网! | 天然鹅卵石滤料厂家-锰砂滤料-石英砂滤料-巩义东枫净水 | 外贸网站建设-外贸网站设计制作开发公司-外贸独立站建设【企术】 | 上海小程序开发-小程序制作-上海小程序定制开发公司-微信商城小程序-上海咏熠 | 智成电子深圳tdk一级代理-提供TDK电容电感贴片蜂鸣器磁芯lambda电源代理经销,TDK代理商有哪些TDK一级代理商排名查询。-深圳tdk一级代理 |