掃一掃
關注中圖網
官方微博
本類五星書更多>
-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
大數據處理與分析 版權信息
- ISBN:9787564658731
- 條形碼:9787564658731 ; 978-7-5646-5873-1
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
大數據處理與分析 內容簡介
Python是大數據分析中常用的工具,本書以Python3結合第三方開源工具進行大數據處理與分析,實現了對數據的預處理、可視化和統計分析。本書共11章,首先給出大數據技術的簡介和常用分析工具。然后,介紹了基于Python3實現的大數據預處理、可視化和統計描述,并給出了大數據的統計分析方法,包括假設檢驗、均值檢驗和時間序列預測等。詳細闡述了大數據的經典分析方法,包括聚類分析、判別分析、主成分分析、因子分析方法。*后結合機器學習主流方法,給出了大數據的挖掘分析方法,如回歸分析、神經網絡、關聯規則、決策樹等。本書使用Python語言,所講的內容可操作性強,并配套了相關的實驗數據和代碼,方便讀者動手練習。本書適合對大數據和統計學感興趣的讀者,特別是需要進行大數據處理和分析的學生和研究人員參考使用。
大數據處理與分析 目錄
1 大數據概論 1.1 大數據技術簡介 1.2 數據處理與分析的階段劃分 1.3 大數據分析工具 1.4 本章小結 本章習題2 數據預處理方法 2.1 數據預處理相關概念 2.2 變量類型與數據類型 2.3 數據清洗 2.4 數據集成與數據規約 2.5 數據的離散化與概念分層 2.6 本章小結 本章習題3 數據的統計描述 3.1 數據的統計建模方法 3.2 數據的頻數描述方法 3.3 數據的描述性統計方法 3.4 數據的探索性分析方法 3.5 本章小結 本章習題4 數據的可視化構圖方法 4.1 數據可視化的類型 4.2 可視化圖的類別 4.3 可視化工具 4.4 基本圖表 4.5 本章小結 本章習題5 數據的假設檢驗 5.1 假設檢驗統計學模型 5.2 單個總體參數的假設檢驗 5.3 兩個總體參數的假設檢驗 5.4 本章小結 本章習題6 數據的均值檢驗方法 6.1 均值檢驗的統計學模型 6.2 兩組之間的比較 6.3 多組之間的比較 6.4 本章小結 本章習題7 數據的隨機化模擬與仿真 7.1 統計的重現性現象 7.2 真隨機與偽隨機 7.3 隨機化過程仿真 7.4 隨機化分組與抽樣 7.5 隨機數據的性質分析與程序驗證 7.6 本章小結 本章習題8 數據的時間序列預測 8.1 時間序列的成分和預測方法 8.2 平穩序列和趨勢預測 8.3 多成分序列預測 8.4 Box-Jenkins方法:ARIMA模型 8.5 本章小結 本章習題9 數據的聚類與判別方法 9.1 數據聚類分析的統計學模型 9.2 數據判別分析的統計學模型 9.3 本章小結 本章習題10 數據的主成分分析與因子分析 10.1 統計學模型 10.2 主成分分析方法 10.3 因子分析方法 10.4 本章小結 本章習題11 數據的挖掘分析與機器學習方法 11.1 數據挖掘方法的主要分類 11.2 無監督學習與監督學習 11.3 數據機器學習的主要方法與案例分析 11.4 案例應用與分析 11.5 優化技巧與解決方案升級 11.6 保存和加載訓練后的模型 11.7 本章小結 本章習題參考文獻
展開全部
書友推薦
- >
推拿
- >
我與地壇
- >
龍榆生:詞曲概論/大家小書
- >
伯納黛特,你要去哪(2021新版)
- >
【精裝繪本】畫給孩子的中國神話
- >
名家帶你讀魯迅:故事新編
- >
我從未如此眷戀人間
- >
回憶愛瑪儂
本類暢銷