包郵 高等學(xué)校信息管理學(xué)專業(yè)系列教材大數(shù)據(jù)處理:從采集到可視化
-
>
全國計算機(jī)等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應(yīng)用
-
>
決戰(zhàn)行測5000題(言語理解與表達(dá))
-
>
軟件性能測試.分析與調(diào)優(yōu)實(shí)踐之路
-
>
第一行代碼Android
-
>
JAVA持續(xù)交付
-
>
EXCEL最強(qiáng)教科書(完全版)(全彩印刷)
-
>
深度學(xué)習(xí)
高等學(xué)校信息管理學(xué)專業(yè)系列教材大數(shù)據(jù)處理:從采集到可視化 版權(quán)信息
- ISBN:9787307215146
- 條形碼:9787307215146 ; 978-7-307-21514-6
- 裝幀:一般膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>
高等學(xué)校信息管理學(xué)專業(yè)系列教材大數(shù)據(jù)處理:從采集到可視化 內(nèi)容簡介
本書共分為9章,章數(shù)據(jù)采集,主要介紹了大數(shù)據(jù)的概念、類型及其特征,常見的數(shù)據(jù)采集方法;第2章數(shù)據(jù)清洗,主要討論數(shù)據(jù)質(zhì)量的維度,數(shù)據(jù)可能存在的質(zhì)量問題,常見的數(shù)據(jù)清洗方法;第3章數(shù)據(jù)ETL,重點(diǎn)介紹了MGO方法;第4章數(shù)據(jù)存儲,主要介紹了大數(shù)據(jù)時代的一些主流數(shù)據(jù)存儲平臺和相關(guān)技術(shù);第5章回歸算法,主要介紹了線性回歸、決策樹回歸、隨機(jī)森林回歸等,并介紹了其實(shí)現(xiàn)的主要步驟以及相應(yīng)的Python語言實(shí)現(xiàn)代碼;第6章分類算法,主要介紹了邏輯回歸二分類和多分類、度提升分類樹等;第7章聚類算法,主要介紹了分割聚類、層次聚類、基于密度的聚類;第8章推薦算法,主要介紹了基于關(guān)聯(lián)規(guī)則的推薦、基于內(nèi)容過濾的推薦等主流方法;第9章數(shù)據(jù)可視化的關(guān)鍵技術(shù),主要介紹了數(shù)據(jù)的降維、可視化隱喻及相關(guān)的交互技術(shù)。
高等學(xué)校信息管理學(xué)專業(yè)系列教材大數(shù)據(jù)處理:從采集到可視化 目錄
1.1 大數(shù)據(jù)概念
1.2 大數(shù)據(jù)類型及特征
1.3 數(shù)據(jù)采集方法
1.3.1 問卷調(diào)查方法
1.3.2 網(wǎng)絡(luò)用戶數(shù)據(jù)收集方法
1.3.3 系統(tǒng)曰志采集方法
1.3.4 網(wǎng)絡(luò)數(shù)據(jù)采集方法
第2章 數(shù)據(jù)清洗
2.1 數(shù)據(jù)質(zhì)量維度
2.2 數(shù)據(jù)預(yù)處理之?dāng)?shù)據(jù)可能存在的問題
2.3 數(shù)據(jù)質(zhì)量問題的原因分析
2.3.1 數(shù)據(jù)源數(shù)據(jù)質(zhì)量問題的原因分析
2.3.2 數(shù)據(jù)分析階段數(shù)據(jù)質(zhì)量問題的原因分析
2.4 數(shù)據(jù)預(yù)處理之?dāng)?shù)據(jù)問題處理方法
2.4.1 變化量識別
2.4.2 錯誤拒絕
2.4.3 列清洗
2.4.4 行過濾
2.5 記錄匹配算法
……
高等學(xué)校信息管理學(xué)專業(yè)系列教材大數(shù)據(jù)處理:從采集到可視化 作者簡介
余肖生,博士,教授,三峽大學(xué)計算機(jī)學(xué)院教授,計算機(jī)學(xué)系書記,畢業(yè)于武漢大學(xué)信息管理學(xué)院。近年來發(fā)表各類學(xué)術(shù)論文30余篇,其中CSSCI源刊論文10余篇,多篇論文被EI、CPCI收錄。
- >
有舍有得是人生
- >
詩經(jīng)-先民的歌唱
- >
伯納黛特,你要去哪(2021新版)
- >
姑媽的寶刀
- >
自卑與超越
- >
莉莉和章魚
- >
煙與鏡
- >
唐代進(jìn)士錄