中圖網小程序
一鍵登錄
更方便
本類五星書更多>
-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
高等學校信息管理學專業系列教材大數據處理:從采集到可視化 版權信息
- ISBN:9787307215146
- 條形碼:9787307215146 ; 978-7-307-21514-6
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
高等學校信息管理學專業系列教材大數據處理:從采集到可視化 內容簡介
本書共分為9章,章數據采集,主要介紹了大數據的概念、類型及其特征,常見的數據采集方法;第2章數據清洗,主要討論數據質量的維度,數據可能存在的質量問題,常見的數據清洗方法;第3章數據ETL,重點介紹了MGO方法;第4章數據存儲,主要介紹了大數據時代的一些主流數據存儲平臺和相關技術;第5章回歸算法,主要介紹了線性回歸、決策樹回歸、隨機森林回歸等,并介紹了其實現的主要步驟以及相應的Python語言實現代碼;第6章分類算法,主要介紹了邏輯回歸二分類和多分類、度提升分類樹等;第7章聚類算法,主要介紹了分割聚類、層次聚類、基于密度的聚類;第8章推薦算法,主要介紹了基于關聯規則的推薦、基于內容過濾的推薦等主流方法;第9章數據可視化的關鍵技術,主要介紹了數據的降維、可視化隱喻及相關的交互技術。
高等學校信息管理學專業系列教材大數據處理:從采集到可視化 目錄
第1章 數據采集
1.1 大數據概念
1.2 大數據類型及特征
1.3 數據采集方法
1.3.1 問卷調查方法
1.3.2 網絡用戶數據收集方法
1.3.3 系統曰志采集方法
1.3.4 網絡數據采集方法
第2章 數據清洗
2.1 數據質量維度
2.2 數據預處理之數據可能存在的問題
2.3 數據質量問題的原因分析
2.3.1 數據源數據質量問題的原因分析
2.3.2 數據分析階段數據質量問題的原因分析
2.4 數據預處理之數據問題處理方法
2.4.1 變化量識別
2.4.2 錯誤拒絕
2.4.3 列清洗
2.4.4 行過濾
2.5 記錄匹配算法
……
1.1 大數據概念
1.2 大數據類型及特征
1.3 數據采集方法
1.3.1 問卷調查方法
1.3.2 網絡用戶數據收集方法
1.3.3 系統曰志采集方法
1.3.4 網絡數據采集方法
第2章 數據清洗
2.1 數據質量維度
2.2 數據預處理之數據可能存在的問題
2.3 數據質量問題的原因分析
2.3.1 數據源數據質量問題的原因分析
2.3.2 數據分析階段數據質量問題的原因分析
2.4 數據預處理之數據問題處理方法
2.4.1 變化量識別
2.4.2 錯誤拒絕
2.4.3 列清洗
2.4.4 行過濾
2.5 記錄匹配算法
……
展開全部
高等學校信息管理學專業系列教材大數據處理:從采集到可視化 作者簡介
余肖生,博士,教授,三峽大學計算機學院教授,計算機學系書記,畢業于武漢大學信息管理學院。近年來發表各類學術論文30余篇,其中CSSCI源刊論文10余篇,多篇論文被EI、CPCI收錄。
書友推薦
- >
詩經-先民的歌唱
- >
中國歷史的瞬間
- >
自卑與超越
- >
羅庸西南聯大授課錄
- >
龍榆生:詞曲概論/大家小書
- >
朝聞道
- >
煙與鏡
- >
伯納黛特,你要去哪(2021新版)
本類暢銷