-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
大數據分析與應用實戰 版權信息
- ISBN:9787302575337
- 條形碼:9787302575337 ; 978-7-302-57533-7
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
大數據分析與應用實戰 本書特色
本書特色:(1)文字說明、源代碼與運行結果穿插呈現,結合理論知識與實踐經驗。 (2)凸顯第四代與第三代程序語言不同之處,掌握數據驅動程序設計的特點。 (3)左手用R,右手用Python,厚植追隨**數據科學家的實力。 (4)配套資源豐富,來自各行業的數據處理與分析案例、R/Python對比的源代碼、完整的教學課件。 (5)深入淺出地介紹統計機器學習理論與實務,做中學、學中做,邁向術道兼修的境界。 凝聚數據挖掘、機器學習等多學科的領悟R 與 Python兼修,配套課件、案例、源代碼簡單直白的敘述,帶領讀者認識數據分析與數據科學程序,通過案例代入練習,幫助讀者快速建立數據科學的重要概念。 ——東吳大學巨量資料管理學院院長 許晉雄 博士學者的研究主題多半固定在某些范圍內,很少人能像鄒教授一樣,醉心追求人工智能的*新趨勢、數學分析方法及軟件,讓相關技術落地生根。 ——明志科技大學機械工程系特聘教授兼工程學院院長 梁晶煒 博士鄒教授結合自己多年來的研究經驗和體會,深入淺出地介紹了機器學習基礎及各種統計學習方式下的數據分析方法,對高校學生及相關領域科技工作者有很好的啟發。 ——南京理工大學教授博導、江蘇省應用統計學會秘書長 程龍生 博士來自不同領域的資料處理與分析范例,同時掌握資料分析兩大主流工具 —— R 與 Python,深入淺出地介紹統計機器學習理論與實務。
大數據分析與應用實戰 內容簡介
本書主要介紹大數據分析與應用,包括數據驅動程序設計、數據前處理、統計機器學習基礎、無監督式學習、監督式學習、其他學習方式(集成學習、深度學習、強化學習)等6章內容。 本書特色:文字說明、程序代碼與執行結果等交叉呈現,有助于閱讀理解;提供來自不同領域的資料處理與分析范例;同時掌握數據分析兩大主流工具—— R 與 Python;凸顯第四代與第三代程序語言的不同之處。 本書讀者對象:計算機、人工智能、大數據等相關專業的本科生、研究生,對大數據分析與應用感興趣的社會讀者,以及大數據分析與應用行業的工程技術人員。
大數據分析與應用實戰 目錄
目 錄
第1章 數據驅動程序設計 1
1.1 套件管理 1
1.1.1 基本套件 5
1.1.2 建議套件 6
1.1.3 貢獻套件 9
1.2 環境與輔助說明 11
1.3 R語言數據對象 17
1.3.1 向量 18
1.3.2 矩陣 22
1.3.3 數組 25
1.3.4 列表 28
1.3.5 數據集 31
1.3.6 因子 38
1.3.7 R語言原生數據對象取值 42
1.3.8 R語言衍生數據對象 49
1.4 Python語言數據對象 54
1.4.1 Python語言原生數據對象處理 54
1.4.2 Python語言衍生數據對象取值 62
1.4.3 Python語言類別變量編碼 68
1.5 向量化與隱式循環 71
1.6 編程范式與面向對象概念 77
1.6.1 R語言S3類別 80
1.6.2 Python語言面向對象 84
1.7 控制流程與自定義函數 89
1.7.1 控制流程 89
1.7.2 自定義函數 92
1.8 數據導入與導出 99
1.8.1 R語言數據導入及導出 99
1.8.2 Python語言數據導入及導出 101
1.9 程序調試與效率監測 105
第2章 數據前處理 112
2.1 數據管理 112
2.1.1 R語言數據組織與排序 113
2.1.2 Python語言數據排序 119
2.1.3 R語言數據變形 123
2.1.4 Python語言數據變形 127
2.1.5 R語言數據清理 128
2.1.6 Python語言數據清理 151
2.2 數據摘要與匯總 154
2.2.1 摘要統計量 155
2.2.2 R語言群組與摘要 163
2.2.3 Python語言群組與摘要 172
2.3 特征工程 183
2.3.1 特征轉換與移除 183
2.3.2 特征提取的主成分分析 198
2.3.3 特征選擇 211
2.3.4 結語 216
2.4 大數據處理概念 217
2.4.1 文本數據處理 218
2.4.2 Hadoop分布式文件系統 232
2.4.3 Spark集群計算框架 233
第3章 統計機器學習基礎 237
3.1 隨機誤差模型 238
3.1.1 統計機器學習類型 243
3.1.2 過度擬合 244
3.2 模型性能評量 247
3.2.1 回歸模型性能指標 247
3.2.2 分類模型性能指標 250
3.2.3 模型性能可視化 259
3.3 模型選擇與評定 263
3.3.1 重抽樣與數據分割方法 263
3.3.2 單類模型參數調校 273
3.3.3 比較不同類的模型 287
3.4 相似性與距離 290
3.5 相關與獨立 293
3.5.1 數值變量與順序尺度類別變量 293
3.5.2 名目尺度類別變量 298
3.5.3 類別變量可視化關聯檢驗 307
第4章 無監督式學習 315
4.1 數據可視化 316
4.2 關聯形態挖掘 324
4.2.1 關聯形態評估準則 324
4.2.2 在線音樂城關聯規則分析 325
4.2.3 結語 333
4.3 聚類分析 334
4.3.1 k均值聚類法 335
4.3.2 階層式聚類 346
4.3.3 密度聚類 351
4.3.4 聚類結果評估 355
4.3.5 結語 356
第5章 監督式學習 357
5.1 線性回歸與分類 358
5.1.1 多元線性回歸 358
5.1.2 偏*小二乘法回歸 379
5.1.3 嶺回歸、套索回歸與彈性網罩懲罰模型 385
5.1.4 線性判別分析 392
5.1.5 邏輯回歸分類與廣義線性模型 398
5.2 非線性分類與回歸 401
5.2.1 樸素貝葉斯分類 401
5.2.2 k近鄰法分類 413
5.2.3 支持向量機分類 422
5.2.4 分類與回歸樹 445
第6章 其他學習方式 479
6.1 集成學習 479
6.1.1 拔靴集成法 480
6.1.2 多模激發法 480
6.1.3 隨機森林 489
6.1.4 結語 490
6.2 深度學習 490
6.2.1 人工神經網絡簡介 491
6.2.2 多層感知機 493
6.2.3 卷積神經網絡 502
6.2.4 遞歸神經網絡 507
6.2.5 自動編碼器 510
6.2.6 受限玻爾茲曼機 511
6.2.7 深度信念網絡 513
6.2.8 深度學習參數調校 513
6.3 強化學習 516
參考文獻 521
索引 523
大數據分析與應用實戰 作者簡介
鄒慶士,明志科技大學機械工程系特聘教授兼人工智能暨數據科學研究中心主任。主要從事人工智能與統計機器學習、博弈理論應用、演化式多目標最佳化、彈性制造與工業控制等領域的教學、科研工作。1988年在臺灣中原大學工學院取得學士學位,1990年在臺灣中原大學機械工程研究所取得碩士學位,1994年在臺灣科技大學取得運籌學博士學位,畢業后在臺灣中華大學企業管理學系暨經營管理研究所、臺灣世新大學信息管理學系暨研究所、臺北商業大學信息與決策科學研究所任教,長期講授“數據科學導論”“統計機器學習與決策”“人工智能”等課程。近年來提供大數據分析培訓與咨詢服務,主持氣象、交通、互聯網、電子商務、金融科技、智慧養殖、綠能發電、環境輻射、化工制程等跨領域大數據分析建模產學合作案例,協助從業者學習實際應用統計機器學習技術,并與兩岸多所大專院校合作開授R/Python語言數據科學講座,分享跨領域數據解析的實踐經驗,致力于培育理論與實踐兼具的跨域人才。
- >
巴金-再思錄
- >
名家帶你讀魯迅:故事新編
- >
名家帶你讀魯迅:朝花夕拾
- >
月亮與六便士
- >
山海經
- >
回憶愛瑪儂
- >
羅曼·羅蘭讀書隨筆-精裝
- >
有舍有得是人生