中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
套路!機器學習北美數據科學的私房課

包郵 套路!機器學習北美數據科學的私房課

作者:林薈
出版社:電子工業出版社出版時間:2017-10-01
開本: 32開 頁數: 332
中 圖 價:¥26.8(3.9折) 定價  ¥68.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
溫馨提示:5折以下圖書主要為出版社尾貨,大部分為全新(有塑封/無塑封),個別圖書品相8-9成新、切口
有劃線標記、光盤等附件不全詳細品相說明>>
本類五星書更多>
買過本商品的人還買了

套路!機器學習北美數據科學的私房課 版權信息

  • ISBN:9787121326585
  • 條形碼:9787121326585 ; 978-7-121-32658-5
  • 裝幀:一般膠版紙
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>

套路!機器學習北美數據科學的私房課 本書特色

數據科學家目前是北美zui熱門的職業之一,平均年薪突破10萬美元。但數據科學并不是一個低門檻的行業,除了對數學、統計、計算機等相關領域的技術要求以外,還要相關應用領域的知識。《套路!機器學習》的寫作對象是那些現在從事數據分析相關行業,或者之后想從事數據分析行業的人,意在為實踐者提供數據科學家這門職業的相關信息。讀者可以從閱讀中了解到數據科學能解決的問題,數據科學家需要的技能,及背后的“分析哲學”。對于新手而言,一開始就直奔艱深的理論,很容易因為困難而失去興趣zui終放棄。因此《套路!機器學習》倡導的是一種循序漸進的啟發教學路徑,著重在于數據科學的實際應用,讓讀者能夠重復書中的結果,學習數據分析技能zui好的方式是實踐!為了平衡理論和應用,書中包括了一些選學小節,用來介紹更多的模型數理背景或給出必要的參考資料來源。抽絲剝繭介紹技術內核,幫助大家知其然,同時知其所以然。希望筆者在北美從事數據科學工作多年踏遍大大小小不計其數的坑換來的經驗,能夠幫助讀者更加順利地成為數據科學家!

套路!機器學習北美數據科學的私房課 內容簡介

亞馬遜資深數據科學家李明博士、統計之都創始人謝益輝博士搶先品讀
當前關于大數據、人工智能的炒作著實令人眼花繚亂,如大數據平臺(如Hadoop、Spark),以及一些黑箱模型,如神經網絡,深度學習(實際上就是多層神經網絡)。各路媒體和“磚家”深諳吃瓜群眾不明覺厲的心態,所以就像個“妓院頭牌“似的越發擺譜。作者并沒有打算寫一本數據科學的圣經,告訴你所有關于數據科學的一切;只想盡可能地給大家還原一個真實的數據科學和數據科學家。希望能為后來者提供一些信息,使得讀者們能夠少走彎路。

套路!機器學習北美數據科學的私房課 目錄

第1章 白話數據科學 1
1.1 什么是數據科學 3
1.2 什么是數據科學家 5
1.2.1 數據科學家需要的技能 6
1.2.2 數據科學算法總結 10
1.3 數據科學可以解決什么問題 20
1.3.1 前提要求 20
1.3.2 問題種類 22
1.4 小結 25
第2章 數據集 26
2.1 服裝消費者數據 26
2.2 航空公司滿意度調查 33
2.3 生豬疫情風險預測數據 37
第3章 數據分析流程 41
3.1 從問題到數據 42
3.2 從數據到信息 44
3.3 從信息到行動 46
第4章 數據預處理 47
4.1 介紹 47
4.2 數據清理 50
4.3 缺失值填補 52
4.3.1 中位數或眾數填補 53
4.3.2 K-近鄰填補 54
4.3.3 裝袋樹填補 56
4.4 中心化和標量化 56
4.5 有偏分布 59
4.6 處理離群點 63
4.7 共線性 66
4.8 稀疏變量 70
4.9 編碼名義變量 71
4.10 小結 73
第5章 數據操作 75
5.1 數據讀寫 76
5.1.1 取代傳統數據框的tibble對象 76
5.1.2 高效數據讀寫:readr包 80
5.1.3 數據表對象讀取 83
5.2 數據整合 91
5.2.1 base包:apply() 91
5.2.2 plyr包:ddply()函數 93
5.2.3 dplyr包 96
5.3 數據整形 102
5.3.1 reshape2包 102
5.3.2 tidyr包 105
5.4 小結 107
第6章 基礎建模技術 109
6.1 有監督和無監督 109
6.2 誤差及其來源 111
6.2.1 系統誤差和隨ji誤差 111
6.2.2 因變量誤差 117
6.2.3 自變量誤差 121
6.3 數據劃分和再抽樣 122
6.3.1 劃分訓練集和測試集 123
6.3.2 重抽樣 131
6.4 小結 135
第7章 模型評估度量 136
7.1 回歸模型評估度量 136
7.2 分類模型評估度量 139
7.2.1 Kappa統計量 141
7.2.2 ROC曲線 143
7.2.3 提升圖 145
7.3 小結 146
第8章 特征工程 148
8.1 特征構建 149
8.2 特征提取 152
8.2.1 初步探索特征 153
8.2.2 主成分分析 158
8.2.3 探索性因子分析 163
8.2.4 高維標度化 167
8.2.5 知識擴展:3種降維特征提取方法的理論 171
8.3 特征選擇 177
8.3.1 過濾法 178
8.3.2 繞封法 188
8.4 小結 195
第9章 線性回歸及其衍生 196
9.1 普通線性回歸 197
9.1.1 zui小二乘線性模型 197
9.1.2 回歸診斷 201
9.1.3 離群點、高杠桿點和強影響點 204
9.2 收縮方法 205
9.2.1 嶺回歸 205
9.2.2 Lasso 209
9.2.3 彈性網絡 212
9.3 知識擴展:LASSO的變量選擇功能 213
9.4 主成分和偏*小二乘回歸 215
9.5 小結 221
第10章 廣義線性模型壓縮方法 222
10.1 初識GLMNET 223
10.2 收縮線性回歸 227
10.3 邏輯回歸 235
10.3.1 普通邏輯回歸 235
10.3.2 收縮邏輯回歸 236
10.3.3 知識擴展:群組lasso邏輯回歸 239
10.4 收縮多項回歸 243
10.5 泊松收縮回歸 246
10.6 小結 249
第11章 樹模型 250
11.1 分裂準則 252
11.2 樹的修剪 256
11.3 回歸樹和決策樹 260
11.4 裝袋樹 268
11.5 隨ji森林 273
11.6 助推法 277
11.7 知識擴展:助推法的可加模型框架 283
11.8 知識擴展:助推樹的數學框架 286
11.8.1 數學表達 286
11.8.2 梯度助推數值優化 289
11.9 小結 290
第12章 神經網絡 292
12.1 投影尋蹤回歸(PROJECTION PURSUIT REGRESSION) 293
12.2 神經網絡(NEURAL NETWORKS) 296
12.3 神經網絡擬合 299
12.4 訓練神經網絡 300
12.5 用CARET包訓練神經網絡 302
12.6 小結 311
參考文獻 312
展開全部

套路!機器學習北美數據科學的私房課 相關資料

推薦序一 伴隨著計算機硬件、數據獲取和存儲技術、分布式算法的飛速發展,以及海量數據的積累,數據科學成為近年來飛速發展的學科。但確切地說,數據科學還不是一門定義完善的學科。直到*近兩年,大學里才慢慢開始建立數據科學相關的項目和學位。林薈博士的著作及時地填補了“如何成為成功的數據科學家”領域的空白。由于數據科學家的就業市場非常火熱,很多領域的人才都想通過提升自身技術水平和經驗成為真正的數據科學家。但正如林博士在書中指出的“數據科學家=數據 科學 藝術家”一樣,想成為成功的數據科學家,各個領域的人才需要通過大量的學習和實踐來彌補自身的欠缺。比如傳統的統計學家和計量經濟師需要熟悉編程、數據庫操作和大數據分布式計算架構。對于剛剛畢業的理工科碩士和博士,積累利用真實數據解決實際問題的經驗,提高書面和口頭表達能力,提升團隊協作能力和自身的影響力是至關重要的。 林博士的著作首先系統地闡述了什么是數據科學以及成為成功數據科學家的必要條件。然后通過具體的數據和例子來引導讀者一步步地理解和學習如何獲取這些必要的條件成為真正的數據科學家。本書中各個章節的數據和具體操作都由開源系統的R語言來實現。讀者可以下載所有的數據和代碼,通過自己運行這些代碼來加深對每個章節知識的理解,并且可以很快靈活地學以致用來解決學習和工作中遇到的數據科學相關的項目。 對數據科學家而言,很大一部分精力是要花在數據的理解、整合和預處理上面。林博士通過自己在數據科學領域多年的經驗來仔細講解如何理解和預處理數據,這是本書的亮點之一。沒有很好地理解數據,沒有透徹地了解具體要解決的問題,就不可能找到好的解決方法。接著林博士用語言生動詼諧的例子介紹了在數據科學中常見的模型和方法。讀者可以通過相關例子和代碼來高效理解這些模型和方法,并可以快速地學以致用。雖然幾乎所有的算法都有相應的程序包來實現,但作為成功的數據科學家,理解模型的理論背景和基礎是必需的。因為只有理解了這些程序包的理論基礎,才能有效地對不同數據不同問題來選擇解決的方法并且設置合理的參數。本書對常用模型和方法進行了介紹和引申,可以幫助讀者了解各個模型和方法背后的理論。簡言之,本書系統地闡述了如何成為成功的數據科學家,讀者可以通過本書的數據和代碼,高效學習并能很快應用到實際項目中去。 伴隨著大數據應用從互聯網科技公司普及到傳統商業領域諸如零售、制造、交通、電力和能源、航空航天、金融、醫療保健,以及大數據在各級政府部門政策制定和實施中的應用,數據科學家的需求還會逐年增高。尤其是大數據在新興領域如工業互聯網、物聯網、智能家居和傳感器網絡的重要應用,很多相應的數據科學家的職位也會有新的需求。比如在制造業工業物聯網領域的數據科學家崗位,除了上述提到的知識和經驗,通常還會要求對制造業背后的物理和工程原理有所了解。具備了相應工業的基礎知識和原理,數據科學家才能更好地理解數據并建立有效的模型和應用。這也對各理工科背景的人才敞開了數據科學的大門。同時通過大量用戶數據的積累,數據科學家也對人文學科的人才敞開了大門。數據科學是一個飛速發展的學科,它通過數據和模型來影響各個學科和領域從而產生價值。數據科學家使得采集的數據有了真正的用武之地。對數據科學感興趣的人才們,請從本書開始,不斷提升自己的技術和經驗,真正成為成功的數據科學家,為各行各業帶來顛覆性的創新吧! 李明寫于美國西雅圖,默瑟島 2017年6月中心序言作者簡介:李明博士,畢業于美國愛荷華州立大學(Iowa State University )擁有物理和統計學背景。曾任通用電氣全球研發中心(GE Global Research Center)統計方向負責人(Statistical Leader),沃爾瑪技術部(WalmartTechnology)數據科學家(Data Scientist)。現任美國亞馬遜(Amazon)資深數據科學家(Senior Data Scientist)。李博士還擔任美國統計學會(American Statistical Association)質量和生產力分會(Quality and Productivity Section)2017年度主席,以及統計在物理和工程應用年度獎評選委員會主席(SPES Award,one of American Statistical Association annual awards)。李博士的職業生涯中曾涉及金融、零售、制造、電力和能源、交通、醫療保健和航空航天等多個產業及相關跨產業領域。 推薦序二 又來一個找我寫序的……感覺自己都快成了寫序專業戶,慚愧慚愧。以前叫我寫序的作者我一般都不熟,但這次這位我還算熟,所以終于可以說點電視上不讓播的內容了。八年前林博士和我一同進入愛荷華州立大學(俗稱Ames村辦大學)統計系讀博,當時我們的背景完全相反:我在測度論課上奄奄一息,在R里如魚得水,林薈在R入門課上死去活來,在理論課上羽化登仙。毫不臉紅地吹個牛:要不是我當年的提攜,她早就能寫出這本書了。 玩笑歸玩笑。總的來說,看到這本書時我還是吃了一驚。看來我讀博的時候一定是遇到了一個“假林”薈。盡管上學的時候她在村辦大學的牲口學院(好吧,獸醫學院)有一些科研經歷,但我記得也就是畫畫ROC曲線、跑跑邏輯回歸而已。士別三年,竟然已經成了一名R 語言老司機,而且還寫出一本主題這么宏大的書。書里舉的例子都是種子、生豬、農業論壇,鬼知道她這幾年都經歷了些什么。以前她抗拒寫代碼,主要原因是對著電腦時間長了怕臉上長痘,看來后來還是決定為(數據)科學獻身了。我們假裝感動三秒鐘。 書的內容我大致看了一遍,因為都是熟人,我評價起來也就不客套了;按書的內容,分兩方面說:R語言和數據科學。 一般來說,我不在乎別人的R代碼寫得好不好,因為反正寫得再好也沒我寫得好(明年請在我的墳頭多燒兩張紙)。我對計算機相關書籍的*標準是不要把“閾值”寫成“閥值”,我仔細看過了,本書作者寫的是對的。看R相關的書籍時,我也有個怪癖,就是找有沒有 if (x == TRUE) 或者 y[which(y > 3)]這樣的語句,其實語句都沒錯,只是看看作者的強迫癌是不是到了晚期(if (x)和y[y > 3]就已足夠)。本書作者似乎沒有患強迫癌。不過這也無妨,很多時候我覺得對代碼吹毛求疵反而影響效率,而且不太老的司機分享的經驗對新司機可能更有用。在我眼中,這本書在 R 方面有兩個亮點:一是里面介紹了很多 R 的附加包,例如 caret,讀者拿起來應該能很快上手;二是幾乎以假亂真地模擬數據,這一點可能會為人詬病(不是真實數據),但我覺得模擬數據有其獨特的價值,就是你掌控著整個小宇宙,數據從生成到建模到解釋,一路的過程你都可以看清楚,而且可以變著法子變換新數據玩,學習模型使用方法。 數據科學我就不敢妄言了,畢竟我畢業之后已經轉向純碼農,很少做有關統計或數據的一線工作。就我的快速粗讀來看,我感覺話題的覆蓋范圍很廣,但深度也比較適宜。廣度和深度通常只能二選一,也沒有優劣之分。我讀書少,也限于篇幅,就隨意翻兩頁點評兩個例子,從我自己的視角管窺一下本書的價值。比如多年前我就堅信,講主成分分析的人如果不馬上講偏*小二乘就是耍流氓,尤其是主成分回歸,是流氓中的流氓,而本書作者很明確地指出了主成分回歸的弊病。再比如Bootstrap方法,作者講,“假如你只有一個樣本,難道你不停地有放回抽樣就能得到大樣本了?”這是很漂亮的一拳。很多方法因為實施簡單,所以很容易讓人忘了它們的先決條件。我非常反對迷信模型或方法甚至軟件,世上沒那么多萬金油。基于同樣的原因,我很欣慰看到本書不是清一色 ggplot2圖形(雖然有些圖可能長得略丑,但想得美就好了)。 仔細看完本書的話應該能看出作者是蘋果粉(某一頁上畫圖時字體用的是Songti SC)以及“段子狗”。都讀完了博士,選電腦還這么看臉,還整天為各種段子操碎了心,所以這位數據科學家也是蠻拼的。 謝益輝寫于奧馬哈

套路!機器學習北美數據科學的私房課 作者簡介

2013年至今任美國杜邦公司商業數據科學家。北京師范大學數學科學學院本科,愛荷華州立大學統計學院碩士和博士。曾任愛荷華州立大學獸醫學院統計咨詢師(2009-2013)及商學院分析咨詢師(2012-2013)。當選2017-2018美國統計協會市場營銷統計項目主席。翻譯出版了《應用預測建模》和《R語言市場研究分析》。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 国际线缆连接网 - 连接器_线缆线束加工行业门户网站 | 河南正规膏药生产厂家-膏药贴牌-膏药代加工-修康药业集团官网 | 山东氧化铁红,山东铁红-淄博科瑞化工有限公司 | 航空铝型材,7系铝型材挤压,硬质阳*氧化-余润铝制品 | 无菌实验室规划装修设计-一体化实验室承包-北京洁净净化工程建设施工-北京航天科恩实验室装备工程技术有限公司 | RV减速机-蜗轮蜗杆减速机-洗车机减速机-减速机厂家-艾思捷 | 高铝轻质保温砖_刚玉莫来石砖厂家_轻质耐火砖价格 | 多功能干燥机,过滤洗涤干燥三合一设备-无锡市张华医药设备有限公司 | 粉末冶金-粉末冶金齿轮-粉末冶金零件厂家-东莞市正朗精密金属零件有限公司 | 国际船舶网 - 船厂、船舶、造船、船舶设备、航运及海洋工程等相关行业综合信息平台 | 碳纤维复合材料制品生产定制工厂订制厂家-凯夫拉凯芙拉碳纤维手机壳套-碳纤维雪茄盒外壳套-深圳市润大世纪新材料科技有限公司 | LED太阳能中国结|发光红灯笼|灯杆造型灯|节日灯|太阳能灯笼|LED路灯杆装饰造型灯-北京中海轩光电 | 新疆十佳旅行社_新疆旅游报价_新疆自驾跟团游-新疆中西部国际旅行社 | 酒糟烘干机-豆渣烘干机-薯渣烘干机-糟渣烘干设备厂家-焦作市真节能环保设备科技有限公司 | 无线讲解器-导游讲解器-自助讲解器-分区讲解系统 品牌生产厂家[鹰米讲解-合肥市徽马信息科技有限公司] | 家乐事净水器官网-净水器厂家「官方」 | 理化生实验室设备,吊装实验室设备,顶装实验室设备,实验室成套设备厂家,校园功能室设备,智慧书法教室方案 - 东莞市惠森教学设备有限公司 | 东莞工厂厂房装修_无尘车间施工_钢结构工程安装-广东集景建筑装饰设计工程有限公司 | 精密模具-双色注塑模具加工-深圳铭洋宇通 | 高低温万能试验机_拉力试验机_拉伸试验机-馥勒仪器科技(上海)有限公司 | 必胜高考网_全国高考备考和志愿填报信息平台 | Eiafans.com_环评爱好者 环评网|环评论坛|环评报告公示网|竣工环保验收公示网|环保验收报告公示网|环保自主验收公示|环评公示网|环保公示网|注册环评工程师|环境影响评价|环评师|规划环评|环评报告|环评考试网|环评论坛 - Powered by Discuz! | 低浓度恒温恒湿称量系统,强光光照培养箱-上海三腾仪器有限公司 | 超声波乳化机-超声波分散机|仪-超声波萃取仪-超声波均质机-精浩机械|首页 | 定制/定做衬衫厂家/公司-衬衫订做/订制价格/费用-北京圣达信 | 艺术生文化课培训|艺术生文化课辅导冲刺-济南启迪学校 | 合肥抖音SEO网站优化-网站建设-网络推广营销公司-百度爱采购-安徽企匠科技 | 浙江皓格药业有限公司| 智能楼宇-楼宇自控系统-楼宇智能化-楼宇自动化-三水智能化 | 苏州防水公司_厂房屋面外墙防水_地下室卫生间防水堵漏-苏州伊诺尔防水工程有限公司 | 紧急切断阀_气动切断阀_不锈钢阀门_截止阀_球阀_蝶阀_闸阀-上海上兆阀门制造有限公司 | 济南品牌包装设计公司_济南VI标志设计公司_山东锐尚文化传播 | 印刷人才网 印刷、包装、造纸,中国80%的印刷企业人才招聘选印刷人才网! | 山东锐智科电检测仪器有限公司_超声波测厚仪,涂层测厚仪,里氏硬度计,电火花检漏仪,地下管线探测仪 | 海鲜池-专注海鲜鱼缸、移动海鲜缸、饭店鱼缸设计定做-日晟水族厂家 | 干法制粒机_智能干法制粒机_张家港市开创机械制造有限公司 | 橡胶接头_橡胶软接头_可曲挠橡胶接头-巩义市创伟机械制造有限公司 | 通辽信息港 - 免费发布房产、招聘、求职、二手、商铺等信息 www.tlxxg.net | 撕碎机_轮胎破碎机_粉碎机_回收生产线厂家_东莞华达机械有限公司 | 防爆电机_防爆电机型号_河南省南洋防爆电机有限公司 | 粘度计维修,在线粘度计,二手博勒飞粘度计维修|收购-天津市祥睿科技有限公司 |