-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
數據科學概論(數字教材版) 版權信息
- ISBN:9787300290607
- 條形碼:9787300290607 ; 978-7-300-29060-7
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
數據科學概論(數字教材版) 內容簡介
本書是一本數據科學與大數據技術專業的入門書籍。每個知識點盡量從實際的應用案例出發,從數據出發,以問題為導向,在解決問題中學習數據挖掘、機器學習等數據科學相關方法。本書將數據讀寫、數據清洗和預處理作為開端,逐漸深入到和數據科學相關的決策樹、支持向量機、神經網絡、無監督學習等知識。此外,結合數據科學的實際應用,書中還講解了推薦算法、文本挖掘和社交網絡分析等熱門實用技術。
數據科學概論(數字教材版) 目錄
1.1 數據科學的概念
1.1.1 數據科學的研究對象
1.1.2 常見的數據科學方法
1.2 數據科學的發展變遷
1.2.1 數據科學的前身:統計學
1.2.2 當代統計學:數據科學
1.3 數據科學的應用領域
1.3.1 互聯網行業
1.3.2 零售行業
1.3.3 金融行業
1.3.4 醫療健康行業
第2章 數據科學的編程工具
2.1 R簡介
2.1.1 安裝和設置
2.1.2 基礎操作
2.1.3 數據結構
2.1.4 基礎語法
2.2 Python和數據科學
2.2.1 安裝和使用
2.2.2 數據結構
2.2.3 基礎語法
2.3 Julia簡介
2.3.1 安裝和使用
2.3.2 編程基礎
第3章 數據科學的數學基礎
3.1 線性代數
3.1.1 向量基礎
3.1.2 矩陣運算
3.2 概率論和數理統計
3.2.1 隨機變量和分布
3.2.2 數理統計簡介
3.3 *優化方法
3.3.1 非線性規劃
3.3.2 線性規劃
第4章 數據科學的統計原則
4.1 可重復原則
4.1.1 數據的擾動
4.1.2 模型的擾動
4.2 可預測原則
4.2.1 可預測性
4.2.2 交叉驗證
4.3 可計算原則
4.3.1 大數據時代的數據特征
4.3.2 大規模數據的處理方法
4.3.3 高維/超高維數據的處理方法
第5章 數據可視化
5.1 基礎統計圖形
5.1.1 圖形設備
5.1.2 基礎作圖
5.1.3 ggplot繪圖語言
5.2 可視化與數據分析
5.2.1 單變量的分布
5.2.2 兩變量的關系
5.2.3 多變量的關系
5.3 現代數據可視化方法
5.3.1 動態統計圖形
5.3.2 交互式工具
第6章 數據挖掘和機器學習
6.1 從海量數據到大數據
6.1.1 海量數據與數據挖掘
6.1.2 大數據與機器學習
6.2 無監督學習
6.2.1 主成分分析
6.2.2 聚類分析
6.3 有監督學習
6.3.1 回歸分析
6.3.2 分類問題和分類性能評估
6.3.3 常用分類模型
第7章 人工智能
7.1 人工智能簡史
7.1.1 人工智能的發展歷史
7.1.2 從神經網絡到深度學習
7.2 神經網絡簡介
7.2.1 神經網絡模型
7.2.2 感知機的學習
7.2.3 BP算法
7.3 深度學習基礎
7.3.1 常見深度學習框架
7.3.2 MXNet簡介
7.3.3 深度學習實戰
第8章 非結構化數據分析
8.1 圖像分析
8.1.1 圖像處理基礎
8.1.2 卷積神經網絡
8.1.3 圖像分類示例
8.2 文本分析
8.2.1 文本數據的處理
8.2.2 文本分類示例
8.2.3 句法分析
8.3 音頻分析
8.3.1 音頻數據的處理
8.3.2 音頻特征的提取
第9章 數據庫和數據倉庫
9.1 數據結構簡介
9.1.1 數據的測量尺度
9.1.2 數據的基礎類型
9.1.3 數據的邏輯結構
9.2 數據庫和SQL
9.2.1 數據庫基礎介紹
9.2.2 常見的數據庫產品
9.2.3 SQL語句簡介
9.3 數據倉庫和商業智能
9.3.1 數據倉庫基礎介紹
9.3.2 數據倉庫的多維模型
9.3.3 BI分析簡介
第10章 大數據平臺
10.1 大數據和云計算
10.1.1 大數據技術的發展變遷
10.1.2 云計算簡介
10.2 并行計算框架
10.2.1 并行計算簡介
10.2.2 共享內存和GPU計算
10.2.3 MPI并行
10.3 分布式存儲與Hadoop
10.3.1 容器和Docker
10.3.2 Hadoop和MapReduce
10.3.3 Spark簡介
……
第11章 可重復研究與產品化
第12章 數據科學的行業應用
參考文獻
數據科學概論(數字教材版) 作者簡介
李揚,中國人民大學統計學院教授、博士生導師、副院長,統計咨詢研究中心主任;國際統計學會推選會員、中國商業統計學會副會長、北京生物醫學統計與數據管理研究會監事長、北京大數據協會綜合評價專業委員會主任委員。主要從事相關型數據分析、模型選擇與不確定性評價、潛變量建模、臨床試驗設計等領域研究,承擔國家自然科學基金面上項目、全國統計科學研究重大項目等科研項目二十余項,在《統計研究》、JASA、JAMA IM、Biometrics、Biostatistics等國內外期刊發表論文五十余篇。 李艦,統計學本科、軟件工程碩士、商學博士,數據科學領域的多年從業者,見證并參與了統計學從冷門專業到顯學的過程。是“統計之都”社區的核心成員之一、一些開源社區的活躍貢獻者,致力于數據科學在實體行業的應用。著有《統計之美》《數據科學中的R語言》。
- >
大紅狗在馬戲團-大紅狗克里弗-助人
- >
伊索寓言-世界文學名著典藏-全譯本
- >
史學評論
- >
月亮虎
- >
龍榆生:詞曲概論/大家小書
- >
名家帶你讀魯迅:故事新編
- >
詩經-先民的歌唱
- >
李白與唐代文化