包郵 JavaJAVA數(shù)據(jù)分析指南
-
>
全國計(jì)算機(jī)等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應(yīng)用
-
>
決戰(zhàn)行測5000題(言語理解與表達(dá))
-
>
軟件性能測試.分析與調(diào)優(yōu)實(shí)踐之路
-
>
第一行代碼Android
-
>
JAVA持續(xù)交付
-
>
EXCEL最強(qiáng)教科書(完全版)(全彩印刷)
-
>
深度學(xué)習(xí)
JavaJAVA數(shù)據(jù)分析指南 版權(quán)信息
- ISBN:9787115494863
- 條形碼:9787115494863 ; 978-7-115-49486-3
- 裝幀:一般膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>>
JavaJAVA數(shù)據(jù)分析指南 本書特色
當(dāng)今,數(shù)據(jù)科學(xué)已經(jīng)成為一個熱門的技術(shù)領(lǐng)域,例如數(shù)據(jù)處理、信息檢索、機(jī)器學(xué)習(xí)、自然語言處理、數(shù)據(jù)可視化等都得到了廣泛的應(yīng)用和發(fā)展。而Java作為一門經(jīng)典的編程語言,在數(shù)據(jù)科學(xué)領(lǐng)域也有著突出的表現(xiàn)。 本書旨在通過Java編程來引導(dǎo)讀者更好地進(jìn)行數(shù)據(jù)分析。本書包含11章內(nèi)容,詳細(xì)地介紹了數(shù)據(jù)科學(xué)導(dǎo)論、數(shù)據(jù)預(yù)處理、數(shù)據(jù)可視化、統(tǒng)計(jì)、關(guān)系數(shù)據(jù)庫、回歸分析、分類分析、聚類分析、推薦系統(tǒng)、NoSQL數(shù)據(jù)庫以及Java大數(shù)據(jù)分析等重要主題。 本書適合想通過Java解決數(shù)據(jù)科學(xué)問題的讀者,也適合數(shù)據(jù)科學(xué)領(lǐng)域的專業(yè)人士以及普通的Java開發(fā)者閱讀。通過閱讀本書,讀者將能夠?qū)?shù)據(jù)分析有更加深入的理解,并且掌握實(shí)用的數(shù)據(jù)分析技術(shù)。
JavaJAVA數(shù)據(jù)分析指南 內(nèi)容簡介
當(dāng)今,數(shù)據(jù)科學(xué)已經(jīng)成為一個熱門的技術(shù)領(lǐng)域,例如數(shù)據(jù)處理、信息檢索、機(jī)器學(xué)習(xí)、自然語言處理、數(shù)據(jù)可視化等都得到了廣泛的應(yīng)用和發(fā)展。而Java作為一門經(jīng)典的編程語言,在數(shù)據(jù)科學(xué)領(lǐng)域也有著突出的表現(xiàn)。 本書旨在通過Java編程來引導(dǎo)讀者更好地進(jìn)行數(shù)據(jù)分析。本書包含11章內(nèi)容,詳細(xì)地介紹了數(shù)據(jù)科學(xué)導(dǎo)論、數(shù)據(jù)預(yù)處理、數(shù)據(jù)可視化、統(tǒng)計(jì)、關(guān)系數(shù)據(jù)庫、回歸分析、分類分析、聚類分析、推薦系統(tǒng)、NoSQL數(shù)據(jù)庫以及Java大數(shù)據(jù)分析等重要主題。 本書適合想通過Java解決數(shù)據(jù)科學(xué)問題的讀者,也適合數(shù)據(jù)科學(xué)領(lǐng)域的專業(yè)人士以及普通的Java開發(fā)者閱讀。通過閱讀本書,讀者將能夠?qū)?shù)據(jù)分析有更加深入的理解,并且掌握實(shí)用的數(shù)據(jù)分析技術(shù)。
JavaJAVA數(shù)據(jù)分析指南 目錄
1.1 數(shù)據(jù)分析起源 1
1.2 科學(xué)方法 2
1.3 精算科學(xué) 2
1.4 蒸汽計(jì)算 3
1.5 一個驚人的例子 4
1.6 赫爾曼·何樂禮 5
1.7 ENIAC 6
1.8 VisiCalc 7
1.9 數(shù)據(jù)、信息和知識 7
1.10 為什么用Java 7
1.11 Java集成開發(fā)環(huán)境 8
1.12 小結(jié) 10
第 2章 數(shù)據(jù)預(yù)處理 11
2.1 數(shù)據(jù)類型 11
2.2 變量 12
2.3 數(shù)據(jù)點(diǎn)和數(shù)據(jù)集 12
2.4 關(guān)系數(shù)據(jù)庫表 13
2.4.1 關(guān)鍵字段 13
2.4.2 鍵—值對 14
2.5 哈希表 14
2.6 文件格式 16
2.6.1 微軟Excel數(shù)據(jù) 18
2.6.2 XML和JSON數(shù)據(jù) 21
2.7 生成測試數(shù)據(jù)集 27
2.7.1 元數(shù)據(jù) 28
2.7.2 數(shù)據(jù)清洗 29
2.7.3 數(shù)據(jù)縮放 30
2.7.4 數(shù)據(jù)過濾 30
2.7.5 排序 33
2.7.6 合并 34
2.7.7 散列法 37
2.8 小結(jié) 38
第3章 數(shù)據(jù)可視化 39
3.1 表和圖 40
3.1.1 散點(diǎn)圖 40
3.1.2 線圖 42
3.1.3 條形圖 43
3.1.4 直方圖 43
3.2 時(shí)間序列 45
3.3 Java實(shí)現(xiàn) 46
3.4 移動平均 49
3.5 數(shù)據(jù)排序 53
3.6 頻率分布 55
3.7 正態(tài)分布 57
3.8 指數(shù)分布 59
3.9 Java示例 59
3.10 小結(jié) 61
第4章 統(tǒng)計(jì) 62
4.1 描述性統(tǒng)計(jì)量 62
4.2 隨機(jī)抽樣 65
4.3 隨機(jī)變量 67
4.4 概率分布 67
4.5 累積分布 69
4.6 二項(xiàng)分布 70
4.7 多元分布 74
4.8 條件概率 76
4.9 概率事件的獨(dú)立性 77
4.10 列聯(lián)表 78
4.11 貝葉斯定理 78
4.12 協(xié)方差和相關(guān) 80
4.13 標(biāo)準(zhǔn)正態(tài)分布 82
4.14 中心極限定理 86
4.15 置信區(qū)間 87
4.16 假設(shè)檢驗(yàn) 89
4.17 小結(jié) 91
第5章 關(guān)系數(shù)據(jù)庫 92
5.1 關(guān)系數(shù)據(jù)模型 92
5.2 關(guān)系數(shù)據(jù)庫 93
5.3 外鍵 94
5.4 關(guān)系數(shù)據(jù)庫設(shè)計(jì) 95
5.4.1 創(chuàng)建數(shù)據(jù)庫 96
5.4.2 SQL命令 100
5.4.3 數(shù)據(jù)插入數(shù)據(jù)庫 104
5.4.4 數(shù)據(jù)庫查詢 106
5.4.5 SQL數(shù)據(jù)類型 107
5.4.6 JDBC 108
5.4.7 使用JDBC PreparedStatement 110
5.4.8 批處理 112
5.4.9 數(shù)據(jù)庫視圖 115
5.4.10 子查詢 119
5.4.11 表索引 121
5.5 小結(jié) 123
第6章 回歸分析 124
6.1 線性回歸 124
6.1.1 Excel中的線性回歸 125
6.1.2 計(jì)算回歸系數(shù) 129
6.1.3 變異統(tǒng)計(jì)量 131
6.1.4 線性回歸的Java實(shí)現(xiàn) 134
6.1.5 安斯庫姆的四重奏 141
6.2 多項(xiàng)式回歸 143
6.2.1 多元線性回歸 147
6.2.2 Apache Commons的實(shí)現(xiàn) 150
6.2.3 曲線擬合 151
6.3 小結(jié) 153
第7章 分類分析 154
7.1 決策樹 156
7.1.1 熵和它有什么關(guān)系? 157
7.1.2 ID3算法 160
7.1.3 Weka平臺 171
7.1.4 數(shù)據(jù)的ARFF文件類型 171
7.1.5 Weka的Java實(shí)現(xiàn) 174
7.2 貝葉斯分類器 175
7.2.1 Weka的Java實(shí)現(xiàn) 177
7.2.2 支持向量機(jī)算法 181
7.3 邏輯回歸 184
7.3.1 k近鄰算法 189
7.3.2 模糊分類算法 193
7.4 小結(jié) 194
第8章 聚類分析 195
8.1 測量距離 195
8.2 維數(shù)災(zāi)難 200
8.3 層次聚類法 201
8.3.1 Weka實(shí)現(xiàn) 210
8.3.2 K-均值聚類 212
8.3.3 K-中心點(diǎn)聚類 218
8.3.4 仿射傳播聚類 220
8.4 小結(jié) 228
第9章 推薦系統(tǒng) 229
9.1 效用矩陣 230
9.2 相似性度量 231
9.3 余弦相似性 233
9.4 一個簡單的推薦系統(tǒng) 233
9.5 亞馬遜項(xiàng)目對項(xiàng)目的協(xié)同過濾推薦 244
9.6 實(shí)現(xiàn)用戶評分 250
9.7 大型稀疏矩陣 254
9.8 使用隨機(jī)訪問文件 257
9.9 Netflix大獎賽 260
9.10 小結(jié) 260
第 10章 NoSQL數(shù)據(jù)庫 261
10.1 映射數(shù)據(jù)結(jié)構(gòu) 261
10.2 SQL與NoSQL 263
10.3 Mongo數(shù)據(jù)庫系統(tǒng) 265
10.4 Library數(shù)據(jù)庫 270
10.5 MongoDB的Java開發(fā) 273
10.6 MongoDB的地理空間數(shù)據(jù)庫擴(kuò)展 281
10.7 MongoDB中的索引 282
10.8 為什么選擇NoSQL,為什么選擇MongoDB 283
10.9 其他的NoSQL數(shù)據(jù)庫系統(tǒng) 284
10.10 小結(jié) 284
第 11章 Java大數(shù)據(jù)分析 285
11.1 擴(kuò)展、數(shù)據(jù)分塊和分片 285
11.2 谷歌的PageRank算法 286
11.3 谷歌的MapReduce框架 290
11.4 MapReduce的一些應(yīng)用示例 291
11.5 “單詞計(jì)數(shù)”示例 292
11.6 可擴(kuò)展性 296
11.7 MapReduce的矩陣操作 297
11.8 MongoDB中的MapReduce 301
11.9 Apache Hadoop 302
11.10 Hadoop MapReduce 303
11.11 小結(jié) 304
附錄 Java工具 305
JavaJAVA數(shù)據(jù)分析指南 作者簡介
約翰·哈伯德(John R. Hubbard)任教于賓夕法尼亞州和弗吉尼亞州的高校,從事計(jì)算機(jī)數(shù)據(jù)分析工作長達(dá)40余年。他擁有賓州州立大學(xué)的計(jì)算機(jī)科學(xué)碩士學(xué)位和密歇根大學(xué)的數(shù)學(xué)博士學(xué)位。目前,他在里士滿大學(xué)擔(dān)任數(shù)學(xué)和計(jì)算機(jī)科學(xué)的名譽(yù)教授,他在該校講授數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)庫系統(tǒng)、數(shù)值分析和大數(shù)據(jù)。 哈伯德博士出版了許多著作并發(fā)表過多篇論文,除了本書,他還出版過6本計(jì)算領(lǐng)域的著作。其中某些著作已經(jīng)翻譯為德文、法文、中文和其他5種語言。此外,他還是一位業(yè)余音樂家。
- >
新文學(xué)天穹兩巨星--魯迅與胡適/紅燭學(xué)術(shù)叢書(紅燭學(xué)術(shù)叢書)
- >
中國人在烏蘇里邊疆區(qū):歷史與人類學(xué)概述
- >
中國歷史的瞬間
- >
名家?guī)阕x魯迅:故事新編
- >
羅庸西南聯(lián)大授課錄
- >
有舍有得是人生
- >
隨園食單
- >
史學(xué)評論