-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
機器學習-實用案例解析 版權信息
- ISBN:9787111417316
- 條形碼:9787111417316 ; 978-7-111-41731-6
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
機器學習-實用案例解析 本書特色
《機器學習:實用案例解析》是機器學習和數據挖掘領域的經典圖書,基礎理論與實踐完美的結合,是一部邏輯緊密、內容詳實,適合所有相關技術人員的參考書。 《機器學習:實用案例解析》兩名作者都具有豐富的數據分析、處理工作經驗,是機器學習實踐技術方面的積極實踐者。 “O'Reilly Radar博客有口皆碑。” ——Wired “O'Reilly憑借一系列(真希望當初我也想到了)非凡想法建立了數百萬美元的業務。” ——Business 2.0 “O'Reilly Conference是聚集關鍵思想領袖的絕對典范。” ——CRN “一本O'Reilly的書就代表一個有用、有前途、需要學習的主題。” ——Irish Times “Tim是位特立獨行的商人,他不光放眼于長遠、廣闊的視野并且切實地按照Yogi Berra的建議去做了:'如果你在路上遇到岔路口,走小路(岔路)。'回顧過去Tim似乎每一次都選擇了小路,而且有幾次都是一閃即逝的機會,盡管大路也不錯。” ——Linux Journal
機器學習-實用案例解析 內容簡介
當今各行業,尤其是互聯網,數據規模越來越大,要從中有效地發現模式來提高生產力,用傳統的方式已經幾乎不可能,只能借助計算機來完成諸多使命。因此,機器學習這一新興的學科變得越來越重要,它已經在搜索、推薦、數據挖掘等多個領域閃耀光芒。機器學習是一門交叉學科,內容涉及概率論、統計學、高等數學、計算機科學等多門學科。該學科致力于設計一種讓計算機具有“學習”能力的算法,通過發現經驗數據中隱藏的模式,實現對未知數據的預測。 大數據時代是機器學習*美好的時代,因為數據不再是問題,各類問題都可以收集到海量的數據。但是,對于很多人來說,這一門交叉學科本身卻神秘而陌生,對于沒有系統學習過相關基礎學科的人來說尤其感到“高不可攀”。如今已出版的機器學習相關書籍中,很多都有這個特點:公式多,晦澀難懂。這讓很多程序員出身的人望而卻步。然而,在**次讀到本書的英文版時,譯者就徹底相信:機器學習完全可以講解得通俗易懂,讓知識的傳遞實現“潤物細無聲”。 本書秉承的原則是:實踐出真知,只要多動手,沒有攻克不了的技術難題。因此作者預期的閱讀對象是如電腦黑客般的人,要求對技術有發自內心的求知欲和好奇心,愿意自己動手而非紙上談兵。全書精心選擇了12個機器學習案例,由淺入深,面面俱到,既有基礎知識(如數據分析),也有當前熱門的社交網站推薦案例。書中的每一個案例都由作者娓娓道來,逐一剖析關鍵算法的代碼,沒有絲毫學究氣息,觸動每個機器學習初學者的內心*深處。 書中所有算法都采用r語言實現。r語言是一門用于統計學的開源腳本語言,基于它的開源性,有來自世界各地的開源擁護者貢獻的各種統計學相關的程序包,穩定且方便,尤其是它對數據可視化的支持,更是一柄利器,既輕巧又實用。書中所有源代碼和數據在原書的官方網站上都可以免費下載。在閱讀過程中,猶如作者親至身側,為你講解代碼和思路,為你排除錯誤和優化效果。 全書案例既有分類問題,也有回歸問題;既包含監督學習,也涵蓋無監督學習。所選擇的案例妙趣橫生,如分析ufo目擊記錄、破譯密碼、預測股票、分析美國參議員“結黨”的情況,等等,這里就不“劇透”了,大家自己去享受學習的樂趣吧。 書中12個案例之間的依賴關系不是特別強(除r語言基礎知識外,其余某幾章僅有個別知識點之間存在依賴性),可以像連續劇一樣,逐一播放,也可以像一個個小品一般,挑感興趣的內容分別播放。學習完這些案例之后,相信你會窺見機器學習的一斑,然后再根據自己的實際情況更深入地學習。 本書翻譯工作由三位來自互聯網世界的工程師通力協作完成,其中,來自新浪微博的陳開江負責完成前言及第1~4章的翻譯;來自阿里b2b的劉逸哲負責完成第5、8、9和11章的翻譯;來自阿里一淘的孟曉楠負責完成第6、7、10和12章的翻譯;同時,全書審校工作由來自北京理工大學的羅森林教授義務承擔。 本書能夠得以出版,首先要感謝機械工業出版社的吳怡編輯,是她給了我們三位工程師這個學習知識并傳遞知識的機會,她經驗豐富,在翻譯過程中給予了我們許多建設性的指導意見。其次,要感謝羅森林教授,他在百忙之中為我們擔任全書的審校工作,從而讓國內的機器學習者能感受到這本書應有的魅力。*后,我們要感謝互聯網,因為譯者與本書的緣分始于互聯網,從看到原書、報名翻譯、組成翻譯團隊、翻譯過程中的討論,所有這樣都是通過互聯網完成的。 雖然經過羅森林教授認真審校并且給我們提出了寶貴意見,但是由于譯者本身水平有限,書中譯文勢必還存在不妥甚至錯誤之處,懇請機器學習界的廣大前輩、同仁們不吝賜教,促使我們繼續為大家更好地傳遞先進技術,讓更多機器學習愛好者成為機器學習的黑客。 我們堅信集體智慧是再高的個人智慧都無法企及的,因此真誠希望大家一起來貢獻自己的智慧。三位譯者的微博分別為:http://weibo.com/kaijiangidan(陳開江,@刑無刀)、http://weibo.com/liuyizhe10(劉逸哲,@劉逸哲)、http://weibo.com/u/1911115643(孟曉楠,@xiaonanmeng)。無論是對翻譯本身有任何意見或建議,還是對機器學習方面有心得,都歡迎大家到我們的微博上交流、切磋,我們一起貢獻自己的智慧,在集體智慧中互相學習,共同進步。
機器學習-實用案例解析 目錄
前言
第1章 使用r語言
r與機器學習
第2章 數據分析
分析與驗證
什么是數據
推斷數據的類型
推斷數據的含義
數值摘要表
均值、中位數、眾數
分位數
標準差和方差
可視化分析數據
列相關的可視化
第3章 分類:垃圾過濾
非此即彼:二分類
漫談條件概率
試寫**個貝葉斯垃圾分類器
第4章 排序:智能收件箱
次序未知時該如何排序
按優先級給郵件排序
實現一個智能收件箱
第5章 回歸模型:預測網頁訪問量
回歸模型簡介
預測網頁流量
定義相關性
第6章 正則化:文本回歸
數據列之間的非線性關系:超越直線
避免過擬合的方法
文本回歸
第7章 優化:密碼破譯
優化簡介
嶺回歸
密碼破譯優化問題
第8章 pca:構建股票市場指數
無監督學習
主成分分析
第9章 mds:可視化地研究參議員相似性
基于相似性聚類
如何對美國參議員做聚類
第10章 knn:推薦系統
k近鄰算法
r語言程序包安裝數據
第11章 分析社交圖譜
社交網絡分析
用黑客的方法研究twitter的社交關系圖數據
分析twitter社交網絡
第12章 模型比較
svm:支持向量機
算法比較
參考文獻
機器學習-實用案例解析 相關資料
“易學易懂,用處很大。” —alexandre alves,oracle cep的架構師 “精心織構的代碼完美地詮釋出機器學習的核心要義。” —patrick toohey,mettler-toledo hi-speed軟件工程師 “實例很棒!可用于任何領域!” —john griffin,hibernate search in action一書的合作者 “敘述循序漸進,巧妙地闡述了算法之間的差異。” —stephen mckamey,isomer innovations技術實踐總監
機器學習-實用案例解析 作者簡介
Drew Conway,機器學習專家,擁有豐富的數據分析、處理工作經驗。目前主要利用數學、統計學和計算機技術研究國際關系、沖突和恐怖主義等。他曾作為研究員在美國情報和國防部門供職數年。他擁有紐約大學政治系博士學位,曾為多種雜志撰寫文章,是機器學習領域的著名學者。 John Myles White,機器學習專家,擁有豐富的數據分析、處理工作經驗。目前主要從理論和實驗的角度來研究人類如何做出決定,同時還是幾個流行的R語言程序包的主要維護者,包括ProjectTemplate和log4r。他擁有普林斯頓大學哲學系博士學位,曾為多家技術雜志撰稿,發表過許多關于機器學習的論文,并在眾多國際會議上發表演講。 羅森林,博士,教授,博導。現任北京理工大學信息系統及安全對抗實驗中心主任、專業責任教授。國防科技工業局科學技術委員會成員;《中國醫學影像技術雜志》、《中國介入影像與治療學》編委會委員;全國大學生信息安全技術專題邀請賽專家組副組長;中國人工智能學會智能信息安全專業委員會委員等。主要研究方向為信息安全、數據挖掘、媒體計算、中文信息處理等。負責或參加完成國家自然科學基金、國家科技支撐計劃、863計劃、國家242計劃等省部級以上項目40余項。已發表學術論文90余篇,出版著作8部,出版譯著1部,獲授權專利3項。 陳開江,新浪微博搜索部研發工程師,曾獨立負責微博內容反垃圾系統、微博精選內容挖掘算法、自助客服系統(包括自動回復、主動挖掘、輿情監測)等項目,目前主要從事社交挖掘、推薦算法研究、機器學習、自然語言處理相關工作,研究興趣是社交網絡的個性化推薦。 劉逸哲,阿里巴巴,CBU基礎平臺部搜索與推薦團隊核心技術與query分析方向負責人,機器學習技術領域及圈子負責人。曾任中國雅虎相關性團隊、自然語言處理團隊算法工程師;AvePoint.inc開發工程師,從事企業級搜索引擎開發。研究興趣是機器學習、自然語言處理及個性化推薦等算法在大規模數據上的應用。 孟曉楠,一淘廣告技術,阿里非搜索廣告算法負責人,負責用戶行為分析、建模與細分,RTB競價算法,展示廣告CTR預估與SEM優化。曾工作于網易杭州研究院,參與過分布式全文檢索系統和網易博客產品的數據挖掘算法開發。研究興趣是計算廣告技術、機器學習、大數據技術、信息檢索等。
- >
名家帶你讀魯迅:朝花夕拾
- >
山海經
- >
人文閱讀與收藏·良友文學叢書:一天的工作
- >
回憶愛瑪儂
- >
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)
- >
月亮虎
- >
朝聞道
- >
經典常談