-
>
闖進數學世界――探秘歷史名題
-
>
中醫基礎理論
-
>
當代中國政府與政治(新編21世紀公共管理系列教材)
-
>
高校軍事課教程
-
>
思想道德與法治(2021年版)
-
>
毛澤東思想和中國特色社會主義理論體系概論(2021年版)
-
>
中醫內科學·全國中醫藥行業高等教育“十四五”規劃教材
數據科學 版權信息
- ISBN:9787302662136
- 條形碼:9787302662136 ; 978-7-302-66213-6
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
數據科學 本書特色
《數據科學》(第2版)為國家一流本科課程《數據科學導論》配套建設教材、中國人民大學“十四五”規劃教材,作者因數據科學課程榮獲北京市高等學校教學創新大賽一等獎、產學合作協同育人項目優秀案例項目、北京市優質教材、數據科學50人等多項獎勵,在國內有較大的影響力。本書為作者10余年從事數據科學教學和科研一線的經驗積累。
數據科學 內容簡介
《數據科學》(第2版)是一部系統闡述數據科學理論與實踐的入門教材,內容與時俱進,聯系實際,致力于將**的數據科學動 態、國內外名校的教學經驗,以及當前社會對數據科學人才的需求整合到內容中,同時融入思政教育內容,彰顯中國 特色。 本書共7 章,主要內容包括數據科學的術語與理念、流程與活動、方法與技術、社會及人文、產品與產業、人才 與職業發展以及應用與實踐等,旨在實現理論與實踐、基礎知識與前沿技術、學術研究與實際應用之間的有機融合, 使之成為一部既實用又富有前瞻性的數據科學教材。 本書適合作為高等學校數據科學與大數據技術、大數據管理與應用、計算機科學與技術、統計學、工商管理、信 息管理與信息系統、商業分析等多個專業本科生數據科學課程的教材,也可供數據科學從業人員參考使用。
數據科學 目錄
1.1 關鍵術語 2
1.1.1 DIKW 模型 2
1.1.2 大數據 4
1.1.3 數據科學 7
1.2 核心理念 10
1.2.1 數據驅動型決策 10
1.2.2 數據密集型科學發現 12
1.2.3 數據分析式思維 14
1.2.4 數據科學向善 16
1.2.5 概率近似正確 19
1.2.6 數據資產化管理 19
1.3 學科特征 21
1.3.1 Drew Conway 數據科學韋恩圖 21
1.3.2 Jeffrey D. Ullman 數據科學韋恩圖 23
1.4 典型應用 24
1.4.1 GFT 流感趨勢分析 24
1.4.2 Metromile 的汽車保險創新 25
習題 27
第2 章 數據科學的流程與活動 33
2.1 數據加工 36
2.1.1 數據大小及規范化 36
2.1.2 缺失數據及其處理 37
2.1.3 異常數據及其處理 38
2.1.4 數據維度及降維處理 42
2.2 數據管理 44
VIII 數據科學 第2 版
2.3 數據分析 46
2.3.1 數據分析方法 46
2.3.2 數據分析工具 48
2.4 數據可視化 51
2.4.1 視覺編碼與視覺通道 53
2.4.2 可視分析學 56
2.4.3 常用統計圖表 58
2.5 數據故事化 62
2.5.1 與數據可視化的關系 62
2.5.2 主要特征 64
2.5.3 故事金字塔模型 67
2.5.4 EEEs 模型 68
習題 70
第3 章 數據科學的方法與技術 76
3.1 人工智能 77
3.1.1 定義及特征 77
3.1.2 主要類型 78
3.1.3 與數據科學的關系 80
3.1.4 主要內容 80
3.2 機器學習 81
3.2.1 定義及特征 82
3.2.2 主要類型 83
3.2.3 與數據科學的關系 84
3.2.4 常用機器學習算法 85
3.3 深度學習 88
3.3.1 定義及特征 88
3.3.2 主要類型 88
3.3.3 與數據科學的關系 89
3.3.4 常用深度學習算法 90
3.4 大數據技術 91
3.4.1 定義與特征 91
3.4.2 主要類型 93
3.4.3 與數據科學的關系 94
目 錄 IX
3.4.4 常用大數據技術 95
3.5 數據科學的編程語言 104
3.5.1 定義與特征 104
3.5.2 主要類型 105
3.5.3 與數據科學的關系 105
3.5.4 常用數據科學編程語言 106
習題 110
第4 章 數據科學的社會及人文 117
4.1 偏見及悖論 118
4.1.1 幸存者偏差 118
4.1.2 辛普森悖論 119
4.1.3 伯克森悖論 121
4.2 倫理及道德 122
4.3 隱私保護 123
4.4 A/B 測試 126
4.5 數據安全保障 128
4.5.1 數據安全法 128
4.5.2 P2DR 模型 130
4.6 解釋與信任 130
習題 134
第5 章 數據科學的產品與產業 139
5.1 數據產品 140
5.1.1 數據產品研發的特征 140
5.1.2 數據柔術 141
5.2 數據能力 143
5.2.1 關鍵過程域 144
5.2.2 成熟度等級 146
5.2.3 成熟度評價 147
5.3 數據治理 148
5.3.1 主要內容 149
5.3.2 參考框架 150
5.4 數據科學平臺 152
X 數據科學 第2 版
5.4.1 數據科學平臺的類型 153
5.4.2 數據科學平臺的評價 154
5.5 數據科學的產業 156
習題 158
第6 章 數據科學的人才與職業 162
6.1 數據職業的主要類型 163
6.2 數據科學家的崗位職責 166
6.2.1 以數據為中心的解決方案的提出 166
6.2.2 從海量數據中發現有價值的洞察 166
6.2.3 面向具體業務的算法/ 模型研發 167
6.2.4 假設檢驗與試驗設計 168
6.2.5 數據治理與數據質量控制 168
6.2.6 數據產品的研發及基于數據的傳統產品的創新 168
6.2.7 數據全流程的參與 169
6.2.8 跨部門和跨領域合作 169
6.3 數據科學家的能力要求 170
6.3.1 與數據科學直接相關的知識和技能 170
6.3.2 與數據科學無直接相關的能力要求 171
習題 173
第7 章 數據科學的應用與實踐 178
7.1 業務理解 179
7.2 數據讀入 180
7.3 數據理解 180
7.4 數據準備 181
7.5 模型構建 183
7.6 模型預測 187
7.7 模型評價 187
習題 190
參考文獻 195
附錄A Python 數據分析中常用的語法要點及講解 197
附錄B 例題R 語言版本代碼 205
數據科學 作者簡介
朝樂門,1979年生,中國人民大學數據工程與知識工程教育部重點實驗室、信息資源管理學院副教授,博士生導師;章魚大數據首席數據科學家:中國計算機學會信息系統專委員會委員、ACM高級會員、國際知識管理協會正式委員、全國高校大數據教育聯盟大數據教材專家指導委員會委員;獲得北京市中青年骨干教師稱號、國際知識管理與智力資本杰出成就獎、Emerald/EFMD國際杰出博士論文獎、國家自然科學基金項目優秀項目、中國大數據學術創新獎和中國大數據創新百人等多種獎勵30余項。朝樂門是我國第一部系統闡述數據科學理念、理論、方法、技術和工具的重要專著——《數據科學》(清華大學出版社,2016)的作者。
- >
伊索寓言-世界文學名著典藏-全譯本
- >
【精裝繪本】畫給孩子的中國神話
- >
名家帶你讀魯迅:故事新編
- >
回憶愛瑪儂
- >
唐代進士錄
- >
龍榆生:詞曲概論/大家小書
- >
莉莉和章魚
- >
上帝之肋:男人的真實旅程