中圖網

>

數據庫

>

數據庫理論

數據分析——統計、描述、預測與應用

包郵數據分析——統計、描述、預測與應用

作者：[葡]喬·門德斯·莫雷拉 [巴西]安德烈

出版社：清華大學出版社出版時間：2021-06-01

開本：其他頁數： 252

本類榜單：計算機/網絡銷量榜

中圖價:¥50.8(6.4折) 定價 ~~¥79.0~~ 登錄后可看到會員價

加入購物車收藏

開年大促， 全場包郵

?新疆、西藏除外

本類五星書更多>

>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用

全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用

¥14.4¥45
>
決戰行測5000題(言語理解與表達)

決戰行測5000題(言語理解與表達)

¥44.1¥88
>
軟件性能測試.分析與調優實踐之路

軟件性能測試.分析與調優實踐之路

¥56.2¥69
>
第一行代碼Android

第一行代碼Android

¥55.4¥99
>
JAVA持續交付

JAVA持續交付

¥58.1¥119
>
EXCEL最強教科書(完全版)(全彩印刷)

EXCEL最強教科書(完全版)(全彩印刷)

¥31.1¥69.9
>
深度學習

深度學習

¥92.4¥168

商品詳情
商品評論(0條)

中圖價:¥50.8 加入購物車

版權信息
本書特色
內容簡介
目錄
作者簡介

數據分析——統計、描述、預測與應用版權信息

ISBN：9787302568476
條形碼：9787302568476 ; 978-7-302-56847-6
裝幀：一般膠版紙
冊數：暫無
重量：暫無
所屬分類：
計算機/網絡
>
數據庫
>
數據庫理論

數據分析——統計、描述、預測與應用本書特色

《數據分析——統計、描述、預測與應用》是一本系統論述數據分析的原則和方法的學習指南。本書宏觀而且系統地給出了數據分析的一般理論與方法，這對于理解和進行數據分析實踐極具參考價值。本書涉及的基本概念、基本理論與分析方法的相關術語通俗易懂，易于理解。學習本書無需統計或編程技術的知識基礎。本書三位作者均是數據分析領域的著名科學家，他們在書中深入淺出剖析了數據分析背后的方法論，并給出了練習與實例，便于讀者動手實踐。此外，作者們制作了實用的教學課件，可供相關高校計算機、大數據、金融學等專業授課使用。

數據分析——統計、描述、預測與應用內容簡介

本書介紹數據分析的統計基礎、種類劃分,并列舉大量實例以說明數據分析方法和算法。內容主要分為4部分,部分為章,介紹一些概念,簡單描述數據分析方法和一些實例; 第2部分包括第2~7 章,介紹描述性分析和數據預處理的主要方法,包括描述統計、多元描述分析、聚類以及頻繁模式挖掘等; 第3部分包括第8~12章,介紹預測性分析的主要方法,其中包括多種回歸算法、二元回歸、分類的性能測量以及基于概率和距離測量的方法,以及決策樹、人工神經網絡和支持向量機等較為優選的方法; 第4部分為3章,利用描述和預測這兩種方法,簡單討論文本、網頁以及社交媒體的應用。

數據分析——統計、描述、預測與應用目錄

第1部分背景介紹

第1章我們可以用數據做什么

1.1大數據和數據科學

1.2大數據架構

1.3小數據

1.4什么是數據

1.5數據分析簡單分類

1.6數據使用實例

1.6.1美國威斯康星州的乳腺癌數據

1.6.2波蘭企業破產數據

1.7一個數據分析項目

1.7.1數據分析方法論簡史

1.7.2KDD過程

1.7.3CRISPDM方法

1.8本書的組織結構

1.9本書面向的對象

第2部分理解數據

第2章描述統計學

2.1尺度類型

2.2描述單元分析

2.2.1單元頻數

2.2.2單元數據可視化

2.2.3單元統計

2.2.4常見的單元概率分布

2.3描述性雙元分析

2.3.1兩個定量屬性

2.3.2兩個定性屬性，其中至少有一個是名義屬性

2.3.3兩個序數屬性

2.4本章小結

2.5練習

第3章描述性多元分析

3.1多元頻數

3.2多元數據可視化

3.3多元統計

3.3.1位置多元統計

3.3.2離散多元統計

3.4信息圖和詞云

3.4.1信息圖

3.4.2詞云

3.5本章小結

3.6練習

第4章數據質量和預處理

4.1數據質量

4.1.1缺失值

4.1.2冗余數據

4.1.3不一致數據

4.1.4噪聲數據

4.1.5離群值

4.2轉換為不同的尺度類型

4.2.1名義尺度轉換為相對尺度

4.2.2序數尺度轉換為相對或絕對尺度

4.2.3相對或絕對尺度轉換為序數或名義尺度

4.3轉換為不同尺度

4.4數據轉換

4.5維度降低

4.5.1屬性聚合

4.5.2屬性選擇

4.6本章小結

4.7練習

第5章聚類

5.1距離度量

5.1.1常見屬性類型值之間的差異

5.1.2定量屬性對象的距離度量

5.1.3非常規屬性的距離度量

5.2聚類驗證

5.3聚類技術

5.3.1K均值

5.3.2DBSCAN

5.3.3聚合層次聚類技術

5.4本章小結

5.5練習

第6章頻繁模式挖掘

6.1頻繁項集

6.1.1設置*小支持度閾值

6.1.2Apriori——基于連接的方法

6.1.3Eclat算法

6.1.4FPGrowth

6.1.5*大頻繁項集和閉合頻繁項集

6.2關聯規則

6.3支持度與置信度的意義

6.3.1交叉支持度模式

6.3.2提升度

6.3.3辛普森悖論

6.4其他模式

6.4.1序列模式

6.4.2頻繁序列挖掘

6.4.3閉合和*大序列

6.5本章小結

6.6練習

第7章描述性分析的備忘單和項目

7.1描述性分析備忘單

7.1.1數據總結

7.1.2聚類方法

7.1.3頻繁模式挖掘

7.2描述性分析項目

7.2.1理解業務

7.2.2理解數據

7.2.3準備數據

7.2.4建模

7.2.5評價

7.2.6部署

第3部分預測未知

第8章回歸

8.1預測性能評估

8.1.1泛化

8.1.2模型驗證

8.1.3回歸的預測性能度量

8.2尋找模型參數

8.2.1線性回歸

8.2.2偏差方差權衡

8.2.3收縮方法

8.2.4使用屬性的線性組合方法

8.3技術選型

8.4本章小結

8.5練習

第9章分類

9.1二元分類

9.2分類的預測性能度量

9.3基于距離的學習算法

9.3.1k近鄰算法

9.3.2基于案例的推理

9.4概率分類算法

9.4.1邏輯回歸算法

9.4.2樸素貝葉斯（NB）算法

9.5本章小結

9.6練習

第10章其他預測方法

10.1基于搜索的算法

10.1.1決策樹歸納算法

10.1.2回歸決策樹

10.2基于優化的算法

10.2.1人工神經網絡

10.2.2支持向量機

10.3本章小結

10.4練習

第11章高級預測話題

11.1集成學習

11.1.1Bagging

11.1.2隨機森林

11.1.3AdaBoost

11.2算法的偏差

11.3非二元分類任務

11.3.1單類分類

11.3.2多類分類

11.3.3排序分類

11.3.4多標簽分類

11.3.5層次分類

11.4高級預測數據準備技術

11.4.1數據分類不均衡

11.4.2不完全目標標記

11.5具有監督可解釋技術的描述和預測

11.6練習

第12章預測性分析的備忘單和項目

12.1預測性分析備忘單

12.2預測性分析項目

12.2.1業務理解

12.2.2數據理解

12.2.3數據準備

12.2.4建模

12.2.5評估

12.2.6部署

第4部分常見的數據分析應用

第13章文本、網絡和社交媒體應用

13.1文本挖掘

13.1.1數據采集

13.1.2特征提取

13.1.3剩下的階段

13.1.4趨勢

13.2推薦系統

13.2.1反饋

13.2.2推薦任務

13.2.3推薦技術

13.2.4小結

13.3社交網絡分析

13.3.1社交網絡的表示

13.3.2節點的基本屬性

13.3.3網絡的基本和結構屬性

13.3.4趨勢和小結

13.4練習

附錄A對CRISPDM方法的全面描述

參考文獻

展開全部

數據分析——統計、描述、預測與應用作者簡介

[葡]喬·門德斯·莫雷拉（João Mendes Moreira）博士，葡萄牙波爾圖大學（University of Porto）工程系教授，葡萄牙波爾圖人工智能與決策支持實驗室（LIAAD-INESC TEC, Porto）研究員。 [巴]安德烈·卡瓦略（André de Carvalho）博士，巴西圣保羅大學（São Paulo）數學和計算機科學研究所教授。 [匈]托馬斯·霍瓦斯（Tomá?? Horváth）博士，匈牙利布達佩斯羅蘭大學（Eötvös Loránd University ）助理教授，與斯洛伐克科希策帕沃爾·約瑟夫·沙法利克大學（Pavol Jozef ??afárik University）長期進行科研合作。

商品評論(0條)

寫書評賺書幣

暫無評論……

書友推薦

>
詩經-先民的歌唱
詩經-先民的歌唱
裴溥言
¥14.5~~¥39.8~~
>
大紅狗在馬戲團-大紅狗克里弗-助人
大紅狗在馬戲團-大紅狗克里弗-助人
[美] 諾爾曼·伯德韋爾著，杜可名譯
¥4.5~~¥10.0~~
>
我與地壇
我與地壇
史鐵生
¥16.4~~¥28.0~~
>
我從未如此眷戀人間
我從未如此眷戀人間
史鐵生/汪曾祺
¥20.5~~¥49.8~~
>
姑媽的寶刀
姑媽的寶刀
莫言
¥11.2~~¥30.0~~
>
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
[英] 達爾文著，朱邦芊譯
¥6.3~~¥14.0~~
>
推拿
推拿
畢飛宇
¥12.2~~¥32.0~~
>
苦雨齋序跋文-周作人自編集
苦雨齋序跋文-周作人自編集
周作人著，止庵校訂
¥6.1~~¥16.0~~

本類暢銷

不良情緒應急處理包--孤獨感

中圖網

¥12.9~~¥30~~
不良情緒應急處理包--精神內耗

中圖網

¥12.9~~¥30~~
孩子、家庭和外部世界

唐納德·溫尼科特

¥17.8~~¥56~~
北魏政治史(二)

張金龍著

¥26.2~~¥70~~
北魏政治史(四)

張金龍著

¥24.4~~¥65~~
北魏政治史(八)

張金龍著

¥20.8~~¥55~~

中图网(原中国图书网)：网上书店，尾货特色书店，30万种特价书低至2折！

包郵數據分析——統計、描述、預測與應用

數據分析——統計、描述、預測與應用版權信息

數據分析——統計、描述、預測與應用本書特色

數據分析——統計、描述、預測與應用內容簡介

數據分析——統計、描述、預測與應用目錄

數據分析——統計、描述、預測與應用作者簡介

詩經-先民的歌唱

大紅狗在馬戲團-大紅狗克里弗-助人

我與地壇

我從未如此眷戀人間

姑媽的寶刀

企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)

推拿

苦雨齋序跋文-周作人自編集

不良情緒應急處理包--孤獨感

不良情緒應急處理包--精神內耗

孩子、家庭和外部世界

北魏政治史(二)

北魏政治史(四)

北魏政治史(八)

每日論語

熊千佳昆蟲記

陶潛和櫻子

上海灘的賈斯汀·比伯

時間停止的那一天

女孩們

包郵 數據分析——統計、描述、預測與應用

數據分析——統計、描述、預測與應用 版權信息

數據分析——統計、描述、預測與應用 本書特色

數據分析——統計、描述、預測與應用 內容簡介

數據分析——統計、描述、預測與應用 目錄

數據分析——統計、描述、預測與應用 作者簡介

包郵數據分析——統計、描述、預測與應用

數據分析——統計、描述、預測與應用版權信息

數據分析——統計、描述、預測與應用本書特色

數據分析——統計、描述、預測與應用內容簡介

數據分析——統計、描述、預測與應用目錄

數據分析——統計、描述、預測與應用作者簡介