中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊

包郵 數據科學實用算法

出版社:清華大學出版社出版時間:2019-11-01
開本: 16開 頁數: 383
中 圖 價:¥43.1(4.4折) 定價  ¥98.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
溫馨提示:5折以下圖書主要為出版社尾貨,大部分為全新(有塑封/無塑封),個別圖書品相8-9成新、切口
有劃線標記、光盤等附件不全詳細品相說明>>
本類五星書更多>

數據科學實用算法 版權信息

數據科學實用算法 本書特色

《數據科學實用算法》分為三部分。第I部分“數據約簡”首先討論數據約簡和數據映射等概念,然后講述關聯統計、可擴展算法和分布式計算等基礎知識。第II部分“從數據中提取信息”呈現線性回歸、數據可視化和聚類分析等主題,用一章的篇幅介紹醫療分析的關鍵領域。第III部分“預測分析”通過開發兩個基本且廣泛使用的預測函數(k近鄰和樸素貝葉斯)向讀者介紹預測分析技術,用一章的篇幅專門論述預報,*后一章重點介紹數據流。

數據科學實用算法 內容簡介

《數據科學實用算法》將重點講述數據分析的基石——算法。要成為一名數據分析專家,你必須了解算法原理,否則會產生挫敗感、進入死胡同、浪費時間以及失敗。本書將基本原理、算法和數據融為一體,提供大量Python和R代碼,執行真實的數據分析,幫助你熟練編寫程序,處理富有挑戰性的數據。在學習過程中,你將沉浸在Python中,深入了解數據科學的基本算法和方法,獲得根據新問題改編算法和進行創新分析的能力。
  《數據科學實用算法》面向數學、統計學和計算機科學專業的高年級本科生和研究生,可用作一學期或兩學期的數據分析課本。先修科目要求不高,學過一兩門概率論或統計學課程、接觸過向量和矩陣、學過編程課程的學生不會遇到任何困難。每章結尾處通常進行擴展,介紹數據科學從業者感興趣的創新內容,提供不同難度的練習。本書也非常適合自學,可作為從業人員的參考書籍。

數據科學實用算法 目錄

第I部分 數據約簡
第1 章 數據科學概述 3
1.1 什么是數據科學? 3
1.2 美國的糖尿病數據 5
1.3 《聯邦黨人文集》的作者數據 6
1.4 預測納斯達克股價 8
1.5 述評 9
1.6 關于本書 10
1.7 算法 12
1.8 Python語言 13
1.9 R語言 13
1.10 術語和符號 14
1.11 本書網站 16
第2 章 數據映射和數據字典 17
2.1 數據約簡 17
2.2 政治捐款 18
2.3 字典 19
2.4 教程:大金主 20
2.5 數據約簡 24
2.5.1 符號和術語 24
2.5.2 政治捐款示例 25
2.5.3 映射 26
2.6 教程:選舉周期捐款 27
2.7 相似度度量 33
2.8 教程:計算相似度 37
2.9 關于字典的總結性述評 41
2.10 練習 41
2.10.1 概念練習 41
2.10.2 計算練習 42
第3 章 可擴展算法和聯合統計 45
3.1 引言 45
3.2 示例:美國的肥胖癥數據 46
3.3 關聯統計數據 47
3.4 單變量觀測 48
3.4.1 直方圖 50
3.4.2 直方圖的構建 51
3.5 函數 52
3.6 教程:直方圖的構建 53
3.7 多變量數據 65
3.7.1 符號和術語 65
3.7.2 估計量 66
3.7.3 增廣“矩”矩陣 69
3.7.4 述評 70
3.8 教程:計算相關矩陣 70
3.9 線性回歸簡介 77
3.9.1 線性回歸模型 77
3.9.2 β的估計值 78
3.9.3 準確性評估 81
3.9.4 計算 82
3.10 教程:計算 83
3.11 練習 89
3.11.1 概念練習 89
3.12.2 計算練習 90
第4 章 Hadoop和MapReduce 93
4.1 引言 93
4.2 Hadoop生態系統 94
4.2.1 Hadoop分布式文件系統 94
4.2.2 MapReduce 95
4.2.3 映射 96
4.2.4 約簡 97
4.3 開發Hadoop應用程序 98
4.4 醫療保險支付 98
4.5 命令行環境 99
4.6 教程:編程實現MapReduce算法 100
4.6.1 映射器 102
4.6.2 約簡器 105
4.6.3 概要 108
4.7 教程:使用亞馬遜網絡服務 109
4.8 練習 113
4.8.1 概念練習 113
4.8.2 計算練習 113
第II部分 從數據中提取信息
第5 章 數據可視化 117
5.1 引言 117
5.2 數據可視化的原則 118
5.3 做出正確選擇 121
5.3.1 單變量數據 122
5.3.2 雙變量和多變量數據 125
5.4 利用好這臺機器 132
5.4.1 繪制圖5.2 134
5.4.2 繪制圖5.3 135
5.4.3 繪制圖5.4 136
5.4.4 繪制圖5.5 136
5.4.5 繪制圖5.8 138
5.4.6 繪制圖5.10 139
5.4.7 繪制圖5.11 140
5.5 練習 141 第6 章 線性回歸方法 143
6.1 引言 143
6.2 線性回歸模型 144
6.2.1 示例:抑郁癥、宿命論和簡單化 145
6.2.2 *小二乘法 147
6.2.3 置信區間 149
6.2.4 分布條件 150
6.2.5 假設檢驗 151
6.2.6 警示語 154
6.3 R語言簡介 155
6.4 教程:R語言 156
6.5 教程:大數據集和R語言 159
6.6 因子 164
6.6.1 交互 166
6.6.2 擴展平方和F檢驗 168
6.7 教程:共享單車 171
6.8 殘差分析 175
6.8.1 線性 176
6.8.2 示例:共享單車問題 177
6.8.3 獨立性 179
6.9 教程:殘差分析 182
6.10 練習 185
6.10.1 概念練習 185
6.10.2 計算練習 185
第7 章 醫療分析 189
7.1 引言 189
7.2 行為風險因素監測系統 190
7.2.1 患病率的估計 192
7.2.2 發病率的估計 193
7.3 教程:糖尿病的患病率和發病率 194
7.4 預測具有患病風險的個人 203
7.5 教程:確認具有患病風險的個體 208
7.6 非尋常的人口特征 213
7.7 教程:構建近鄰集合 215
7.8 練習 219
7.8.1 概念練習 219
7.8.2 計算練習 220
第8 章 聚類分析 223
8.1 引言 223
8.2 凝聚層次聚類 224
8.3 各州間的對比 225
8.4 教程:各州的層次聚類 228
8.5 k均值算法 235
8.6 教程:k均值算法 236
8.7 練習 242
8.7.1 概念練習 242
8.7.2 計算練習 242
第III部分 預測分析
第9 章 k近鄰預測函數 247
9.1 引言 247
9.2 符號和術語 249
9.3 距離度量 251
9.4 k近鄰預測函數 252
9.5 指數加權k近鄰 253
9.6 教程:數字識別 255
9.7 準確性估計 262
9.8 k近鄰回歸 264
9.9 預測標準普爾500指數 265
9.10 教程:利用模式回歸進行預測 266
9.11 交叉驗證 273
9.12 練習 275
9.12.1 概念練習 275
9.12.2 計算練習 275 第10 章 多項式樸素貝葉斯預測函數 279
10.1 引言 279
10.2 聯邦黨人文集 280
10.3 多項式樸素貝葉斯預測函數 281
10.4 教程:約簡《聯邦黨人文集》 285
10.5 教程:預測有爭議的《聯邦黨人文集》的作者 291
10.6 教程:客戶細分 294
10.6.1 加法平滑 295
10.6.2 數據 296
10.6.3 述評 303
10.7 練習 303
10.7.1 概念練習 303
10.7.2 計算練習 304
第11 章 預報 307
11.1 引言 307
11.2 教程:處理時間 309
11.3 分析方法 313
11.3.1 符號 313
11.3.2 均值和方差的估計 313
11.3.3 指數預報 315
11.3.4 自相關 316
11.4 教程:計算 318
11.5 漂移和預報 322
11.6 Holt-Winters指數型預報 323
11.7 教程:Holt-Winters預報 326
11.8 基于回歸的股價預報 330
11.9 教程:基于回歸的預報 331
11.10 時變回歸預報器 336
11.11 教程:時變回歸預報器 337
11.12 練習 339
11.12.1 概念練習 339
11.12.2 計算練習 339 第12 章 實時分析 343
12.1 引言 343
12.2 用納斯達克報價數據流進行預報 344
12.3 教程:預報Apple公司信息流 346
12.4 Twitter信息流API 351
12.5 教程:訪問Twitter數據流 352
12.6 情感分析 357
12.7 教程:主題標簽分組的情感分析 358
12.8 練習 360
附錄 A 練習答案 363
附錄 B 使用Twitter API 377
參考文獻 379
展開全部

數據科學實用算法 作者簡介

Brian Steele是蒙大拿州立大學的數學教授,是SoftMath咨詢公司的資深數據科學家。 Steele博士發表過多篇關于EM算法、精確bagging、bootstrap和諸多統計應用的技術文章。Steele主要講授數據分析和統計課程,并為客戶提供與數據科學和統計有關的咨詢。
  John Chandler自1999年以來一直從事最前沿的營銷和數據分析工作,曾幫助多家《財富》100強公司評價廣告效果,改善績效。Chandler博士從2015年開始在蒙大拿州立大學商學院擔任市場營銷教授,講授高級營銷分析和數據科學課程。Chandler也是Ars Quanta咨詢公司的創始人和首席數據科學家。
  Swarna Reddy是蒙大拿州立大學數學系教授,也是SoftMath咨詢公司的創始人、首席執行官和資深數據科學家。Reddy專門研究計算數學和運籌學,曾發表過多篇論文,已開發出多個重大的生物信息學、網絡安全和商業分析方案。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 政府回应:200块在义乌小巷能买到爱情吗?——揭秘打工族省钱约会的生存智慧 | 全自动真空上料机_粉末真空上料机_气动真空上料机-南京奥威环保科技设备有限公司 | 磁力抛光机_磁力研磨机_磁力去毛刺机_精密五金零件抛光设备厂家-冠古科技 | 有机肥设备生产制造厂家,BB掺混肥搅拌机、复合肥设备生产线,有机肥料全部加工设备多少钱,对辊挤压造粒机,有机肥造粒设备 -- 郑州程翔重工机械有限公司 | 排烟防火阀-消防排烟风机-正压送风口-厂家-价格-哪家好-德州鑫港旺通风设备有限公司 | 超声骨密度仪-骨密度检测仪-经颅多普勒-tcd仪_南京科进实业有限公司 | 冷藏车厂家|冷藏车价格|小型冷藏车|散装饲料车厂家|程力专用汽车股份有限公司销售十二分公司 | 数年网路-免费在线工具您的在线工具箱-shuyear.com | 依维柯自动挡房车,自行式国产改装房车,小型房车价格,中国十大房车品牌_南京拓锐斯特房车 - 南京拓锐斯特房车 | 威海防火彩钢板,威海岩棉复合板,威海彩钢瓦-文登区九龙岩棉复合板厂 | 代办建筑资质升级-建筑资质延期就找上海国信启航 | 热熔胶网膜|pes热熔网膜价格|eva热熔胶膜|热熔胶膜|tpu热熔胶膜厂家-苏州惠洋胶粘制品有限公司 | 武汉高低温试验机-现货恒温恒湿试验箱-高低温湿热交变箱价格-湖北高天试验设备 | 压力控制器,差压控制器,温度控制器,防爆压力控制器,防爆温度控制器,防爆差压控制器-常州天利智能控制股份有限公司 | 凝胶成像系统(wb成像系统)百科-上海嘉鹏 | 杭州高温泵_热水泵_高温油泵|昆山奥兰克泵业制造有限公司 | 交通信号灯生产厂家_红绿灯厂家_电子警察监控杆_标志杆厂家-沃霖电子科技 | LHH药品稳定性试验箱-BPS系列恒温恒湿箱-意大利超低温冰箱-上海一恒科学仪器有限公司 | 中开泵,中开泵厂家,双吸中开泵-山东博二泵业有限公司 | 消电检公司,消电检价格,北京消电检报告-北京设施检测公司-亿杰(北京)消防工程有限公司 | 蜂窝块状沸石分子筛-吸附脱硫分子筛-萍乡市捷龙环保科技有限公司 | 视频直播 -摄影摄像-视频拍摄-直播分发 | 西门子伺服电机维修,西门子电源模块维修,西门子驱动模块维修-上海渠利 | 平面钻,法兰钻,三维钻-山东兴田阳光智能装备股份有限公司 | 山东led显示屏,山东led全彩显示屏,山东LED小间距屏,临沂全彩电子屏-山东亚泰视讯传媒有限公司 | 工业洗衣机_工业洗涤设备_上海力净工业洗衣机厂家-洗涤设备首页 bkzzy在职研究生网 - 在职研究生招生信息咨询平台 | 药品冷藏箱厂家_低温冰箱_洁净工作台-济南欧莱博电子商务有限公司官网 | 工业机械三维动画制作 环保设备原理三维演示动画 自动化装配产线三维动画制作公司-南京燃动数字 聚合氯化铝_喷雾聚氯化铝_聚合氯化铝铁厂家_郑州亿升化工有限公司 | 上海道勤塑化有限公司 | 凝胶成像系统(wb成像系统)百科-上海嘉鹏| 高防护蠕动泵-多通道灌装系统-高防护蠕动泵-www.bjhuiyufluid.com慧宇伟业(北京)流体设备有限公司 | 专业的新乡振动筛厂家-振动筛品质保障-环保振动筛价格—新乡市德科筛分机械有限公司 | 讲师宝经纪-专业培训机构师资供应商_培训机构找讲师、培训师、讲师经纪就上讲师宝经纪 | 槽钢冲孔机,槽钢三面冲,带钢冲孔机-山东兴田阳光智能装备股份有限公司 | 防渗膜厂家|养殖防渗膜|水产养殖防渗膜-泰安佳路通工程材料有限公司 | 999范文网_优质范文下载写作帮手| 北京易通慧公司从事北京网站优化,北京网络推广、网站建设一站式服务商-北京网站优化公司 | 合肥通道闸-安徽车牌识别-人脸识别系统厂家-安徽熵控智能技术有限公司 | 硫酸钡厂家_高光沉淀硫酸钡价格-河南钡丰化工有限公司 | 高柔性拖链电缆-聚氨酯卷筒电缆-柔性屏蔽电缆厂家-玖泰电缆 | 超声骨密度仪,双能X射线骨密度仪【起草单位】,骨密度检测仪厂家 - 品源医疗(江苏)有限公司 |