數(shù)據(jù)挖掘-你必須知道的32個(gè)經(jīng)典案例 版權(quán)信息
- ISBN:9787121275791
- 條形碼:9787121275791 ; 978-7-121-27579-1
- 裝幀:一般輕型紙
- 冊(cè)數(shù):暫無(wú)
- 重量:暫無(wú)
- 所屬分類:>>
數(shù)據(jù)挖掘-你必須知道的32個(gè)經(jīng)典案例 本書特色
本書是為廣大數(shù)據(jù)分析師量身定制的入門讀物,它旨在幫助讀者站在大數(shù)據(jù)時(shí)代的制高點(diǎn)。數(shù)據(jù)分析處于統(tǒng)計(jì)學(xué)、計(jì)算機(jī)信息科學(xué)、運(yùn)籌學(xué)、數(shù)據(jù)庫(kù)等多個(gè)領(lǐng)域的交叉地帶,大數(shù)據(jù)時(shí)代的到來(lái)大大豐富了數(shù)據(jù)分析的內(nèi)涵,數(shù)據(jù)分析師的職責(zé)與以往相比發(fā)生了巨大的改變。 本書全面介紹了經(jīng)典數(shù)據(jù)分析、模式識(shí)別、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、數(shù)據(jù)挖掘、商務(wù)智能等多個(gè)領(lǐng)域的數(shù)據(jù)分析算法,將大數(shù)據(jù)時(shí)代的數(shù)據(jù)分析熱點(diǎn)技術(shù)一網(wǎng)打盡。本書為每個(gè)數(shù)據(jù)分析算法都搭配了一個(gè)經(jīng)典案例,并按照由易到難的原則構(gòu)建知識(shí)框架,充分照顧了不同水平讀者的閱讀習(xí)慣。 通過(guò)閱讀本書,讀者將對(duì)大數(shù)據(jù)時(shí)代下的數(shù)據(jù)分析有一個(gè)全面的認(rèn)識(shí)。無(wú)論是入門級(jí)的數(shù)據(jù)分析員還是有一定基礎(chǔ)的數(shù)據(jù)分析師,都能通過(guò)本書完善、加深對(duì)數(shù)據(jù)分析的認(rèn)識(shí)。
數(shù)據(jù)挖掘-你必須知道的32個(gè)經(jīng)典案例 內(nèi)容簡(jiǎn)介
這本書不要求讀者的編程基礎(chǔ)和數(shù)學(xué)知識(shí),以盡量通俗易懂的語(yǔ)言來(lái)解釋晦澀的數(shù)據(jù)挖掘算法原理,本書所保留的數(shù)學(xué)公式都是*基本的、不得不保留的公式,這將本書的閱讀門檻降到了**。學(xué)習(xí)本書,讀者將掌握*實(shí)用的數(shù)據(jù)挖掘算法,并能夠立刻應(yīng)用它們。
數(shù)據(jù)挖掘-你必須知道的32個(gè)經(jīng)典案例 目錄
第1章 經(jīng)典的探索性數(shù)據(jù)分析案例 11.1 探索性數(shù)據(jù)分析綜述 21.2 數(shù)據(jù)巧收集——紅牛的大數(shù)據(jù)營(yíng)銷案例 41.2.1 狀況百出的紅牛企業(yè) 41.2.2 紅牛企業(yè)巧妙收集消費(fèi)者數(shù)據(jù) 61.2.3 數(shù)據(jù)收集小結(jié) 81.3 數(shù)據(jù)可視化——數(shù)據(jù)新聞促使英軍撤軍 91.3.1 維基解密帶來(lái)的海量數(shù)據(jù) 91.3.2 百花齊放的數(shù)據(jù)新聞 111.3.3 數(shù)據(jù)可視化小結(jié) 151.4 異常值分析——facebook消滅釣魚(yú)鏈接 161.4.1 facebook和廣告商之間的拉鋸戰(zhàn) 171.4.2 異常值分析指導(dǎo)排名算法工作 181.4.3 異常值分析小結(jié) 221.5 對(duì)比分析——truecar指導(dǎo)購(gòu)物者尋找*合算的車價(jià) 241.5.1 火中取栗的truecar網(wǎng)站 241.5.2 數(shù)據(jù)對(duì)比贏得消費(fèi)者信賴 261.5.3 對(duì)比分析小結(jié) 29第2章 經(jīng)典的相關(guān)分析與回歸分析案例 312.1 相關(guān)回歸綜述 322.2 皮爾遜相關(guān)值——紐約市政府利用相關(guān)分析監(jiān)控違法建筑 342.2.1 簡(jiǎn)約而不簡(jiǎn)單的消防檢測(cè)系統(tǒng) 342.2.2 使用相關(guān)分析洞察60個(gè)變量的關(guān)系 362.2.3 相關(guān)分析小結(jié) 392.3 時(shí)間序列分析——人壽保險(xiǎn)的可提費(fèi)用預(yù)測(cè) 412.3.1 人壽保險(xiǎn)公司和可提費(fèi)用 412.3.2 使用四種時(shí)間序列回歸預(yù)測(cè)模型解決問(wèn)題 432.3.3 時(shí)間序列分析小結(jié) 462.4 線性回歸分析——梅西百貨公司的十二項(xiàng)大數(shù)據(jù)策略 482.4.1 從“一億豪賭”說(shuō)起的零售商困境 482.4.2 sas公司幫助梅西百貨構(gòu)建模型 502.4.3 線性回歸分析小結(jié) 532.5 logistic回歸分析——大面積流感爆發(fā)的預(yù)測(cè)分析 562.5.1 究竟誰(shuí)才是流感預(yù)測(cè)算法之王 562.5.2 向logistic算法中引入更多變量 582.5.3 logistic回歸分析小結(jié) 61第3章 經(jīng)典的降維數(shù)據(jù)分析案例 633.1 降維分析算法綜述 643.2 粗糙集算法——協(xié)助希臘工業(yè)發(fā)展銀行制定信貸政策 663.2.1 銀行信貸政策的制定原則 663.2.2 粗糙集算法原理和應(yīng)用 673.2.3 粗糙集算法小結(jié) 713.3 因子分析——基于李克特量表的應(yīng)聘評(píng)價(jià)法 733.3.1 源于智力測(cè)試的因子分析 733.3.2 使用因子分析解構(gòu)問(wèn)卷 753.3.3 因子分析小結(jié) 783.4 **尺度分析——直觀評(píng)估消費(fèi)者傾向的分析方法 803.4.1 市場(chǎng)調(diào)查問(wèn)題催生的**尺度分析 803.4.2 六種經(jīng)典的**尺度分析解讀方法 823.4.3 **尺度分析小結(jié) 863.5 pca降維算法——智能人臉識(shí)別的應(yīng)用與拓展 883.5.1 刷臉的時(shí)代來(lái)了 883.5.2 使用pca算法完成降維工作 903.5.3 pca算法小結(jié) 93第4章 經(jīng)典的模式識(shí)別案例 954.1 模式識(shí)別綜述 964.2 圖像分析——谷歌的超前自動(dòng)駕駛技術(shù) 984.2.1 以安全的名義呼吁自動(dòng)駕駛技術(shù) 984.2.2 快速成熟的無(wú)人駕駛技術(shù) 1004.2.3 圖像分析小結(jié) 1034.3 遺傳算法——經(jīng)典的人力資源優(yōu)化問(wèn)題 1054.3.1 使用有限資源實(shí)現(xiàn)利益**化 1054.3.2 遺傳算法的計(jì)算過(guò)程 1074.3.3 遺傳算法小結(jié) 1104.4 決策樹(shù)分析——“沸騰時(shí)刻”準(zhǔn)確判斷用戶健康水平 1114.4.1 打造我國(guó)**健身平臺(tái) 1114.4.2 信息增益和決策樹(shù) 1134.4.3 決策樹(shù)小結(jié) 1164.5 k均值聚類分析——hse24通過(guò)為客戶分類降低退貨率 1184.5.1 在電子商務(wù)市場(chǎng)快速擴(kuò)張的hse24 1194.5.2 使用k均值聚類為客戶分類 1204.5.3 k均值聚類小結(jié) 123第5章 經(jīng)典的機(jī)器學(xué)習(xí)案例 1275.1 機(jī)器學(xué)習(xí)綜述 1285.2 語(yǔ)義搜索——沃爾瑪搜索引擎提升15%銷售額 1305.2.1 注重用戶體驗(yàn)的沃爾瑪公司 1305.2.2 語(yǔ)義搜索引擎的底層技術(shù)和原理 1325.2.3 語(yǔ)義搜索技術(shù)小結(jié) 1355.3 順序分析——搜狗輸入法的智能糾錯(cuò)系統(tǒng) 1375.3.1 搜狗輸入法的王牌詞庫(kù)和智能算法 1375.3.2 頻繁樹(shù)模式和順序分析算法 1405.3.3 順序分析小結(jié) 1435.4 文本分析——經(jīng)典的垃圾郵件過(guò)濾系統(tǒng) 1445.4.1 大數(shù)據(jù)時(shí)代需要文本分析工作 1455.4.2 垃圾郵件過(guò)濾中的分詞技術(shù)和詞集模型 1465.4.3 文本分析小結(jié) 1495.5 協(xié)同過(guò)濾——構(gòu)建個(gè)性化推薦系統(tǒng)的經(jīng)典算法 1515.5.1 協(xié)同過(guò)濾算法為什么這么流行 1515.5.2 基于用戶和基于產(chǎn)品的協(xié)同過(guò)濾 1535.5.3 協(xié)同過(guò)濾算法小結(jié) 155第6章 經(jīng)典的深度學(xué)習(xí)案例 1596.1 深度學(xué)習(xí)綜述 1606.2 支持向量機(jī)——喬布斯利用大數(shù)據(jù)對(duì)抗癌癥 1626.2.1 喬布斯和胰腺癌的八年抗戰(zhàn) 1626.2.2 醫(yī)學(xué)統(tǒng)計(jì)學(xué)和支持向量機(jī) 1646.2.3 支持向量機(jī)小結(jié) 1686.3 感知器神經(jīng)網(wǎng)絡(luò)——**的房產(chǎn)價(jià)格預(yù)測(cè)算法 1696.3.1 如何在我國(guó)預(yù)測(cè)房?jī)r(jià) 1706.3.2 多層感知器和誤差曲面 1716.3.3 感知器神經(jīng)網(wǎng)絡(luò)小結(jié) 1756.4 自組織神經(jīng)網(wǎng)絡(luò)——如何又快又好地解決旅行商問(wèn)題 1776.4.1 **路徑問(wèn)題的典型模式和解決方法 1776.4.2 自組織神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)和權(quán)值調(diào)整 1786.4.3 自組織神經(jīng)網(wǎng)絡(luò)小結(jié) 1826.5 rbm算法——為新聞報(bào)道智能分類 1836.5.1 新聞報(bào)道智能分類的難與易 1836.5.2 rbm算法的學(xué)習(xí)目標(biāo)和學(xué)習(xí)方法 1856.5.3 rbm算法小結(jié) 188第7章 經(jīng)典的數(shù)據(jù)挖掘案例 1917.1 數(shù)據(jù)挖掘綜述 1927.2 判別分析——美國(guó)運(yùn)通構(gòu)建客戶流失預(yù)測(cè)模型 1947.2.1 美國(guó)運(yùn)通公司的舊日輝煌 1947.2.2 判別分析的假設(shè)條件和判別函數(shù) 1967.2.3 判別分析小結(jié) 2007.3 購(gòu)物籃分析——找出零售業(yè)的**商品組合 2017.3.1 名動(dòng)天下的“啤酒和尿布”案例 2027.3.2 購(gòu)物籃分析的頻繁模式 2037.3.3 購(gòu)物籃分析小結(jié) 2077.4 馬爾可夫鏈——準(zhǔn)確預(yù)測(cè)客運(yùn)市場(chǎng)占有率 2087.4.1 復(fù)雜的客運(yùn)市場(chǎng)系統(tǒng) 2097.4.2 概率轉(zhuǎn)移矩陣的求解方法 2107.4.3 馬爾可夫鏈小結(jié) 2137.5 adaboost元算法——有效偵測(cè)欺詐交易的復(fù)合算法 2157.5.1 弱分類器和強(qiáng)分類器之爭(zhēng) 2157.5.2 adaboost元算法的分類器構(gòu)建方法 2177.5.3 adaboost元算法小結(jié) 220第8章 經(jīng)典的商業(yè)智能分析案例 2238.1 商業(yè)智能分析綜述 2248.2 kxen分析軟件——構(gòu)建歐洲博彩業(yè)下注預(yù)測(cè)平臺(tái) 2268.2.1 現(xiàn)代博彩業(yè)背后的黑手 2268.2.2 集體智慧和莊家賠率的聯(lián)系 2288.2.3 kxen軟件小結(jié) 2318.3 數(shù)據(jù)廢氣再利用——物流公司數(shù)據(jù)成功用于評(píng)估客戶信用 2338.3.1 數(shù)據(jù)廢氣和黑暗數(shù)據(jù)的異同 2348.3.2 論如何充分利用物流公司數(shù)據(jù) 2358.3.3 數(shù)據(jù)廢氣再利用小結(jié) 2398.4 必應(yīng)預(yù)測(cè)——使用往期信息預(yù)測(cè)自然災(zāi)害 2408.4.1 預(yù)測(cè)自然災(zāi)害的必要性 2418.4.2 微軟大數(shù)據(jù)預(yù)測(cè)的優(yōu)與劣 2428.4.3 必應(yīng)預(yù)測(cè)小結(jié) 2458.5 點(diǎn)球成金——助力nba大數(shù)據(jù)分析的多種神秘軟件 2468.5.1 nba的有效球員數(shù)據(jù) 2478.5.2 有關(guān)點(diǎn)球成金的靠譜方法 2498.5.3 點(diǎn)球成金小結(jié) 251
展開(kāi)全部
數(shù)據(jù)挖掘-你必須知道的32個(gè)經(jīng)典案例 作者簡(jiǎn)介
任昱衡:博士、副研究員,高級(jí)電子商務(wù)師,高級(jí)硬件工程師,中國(guó)電子商務(wù)協(xié)會(huì)電子商務(wù)研究院副院長(zhǎng),中國(guó)電子商務(wù)協(xié)會(huì)信用體系建設(shè)管理中心主任助理,中國(guó)電子商務(wù)師資質(zhì)(職稱)認(rèn)證管理中心主任助理。參與國(guó)家多項(xiàng)電子商務(wù)法律、法規(guī)、標(biāo)準(zhǔn)制定工作,目前主要負(fù)責(zé)國(guó)家電子商務(wù)師職業(yè)水平(職稱)認(rèn)證體系的構(gòu)建和國(guó)家電子商務(wù)行業(yè)企業(yè)信用監(jiān)管工作。
李倩星:畢業(yè)于西南大學(xué)統(tǒng)計(jì)學(xué)專業(yè),對(duì)數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)以及人工智能領(lǐng)域有深刻的研究。主持翻譯了《傳播學(xué)中的大數(shù)據(jù):發(fā)展與不足》、《大數(shù)據(jù)、一個(gè)新興領(lǐng)域的誤區(qū)和方法與概念》、《數(shù)據(jù)挖掘揭示了差評(píng)導(dǎo)致的負(fù)反饋怪圈》等數(shù)十篇前沿科技文章,并發(fā)表于PPV課社區(qū)。
米曉飛:北京航空航天大學(xué)碩士,現(xiàn)任宜信高級(jí)數(shù)據(jù)分析挖掘工程師。曾在中軟國(guó)際任高級(jí)工程師,一手建立成熟網(wǎng)站,架構(gòu)了大數(shù)據(jù)分析環(huán)境并確立完整的流程,熟悉大數(shù)據(jù)生態(tài)系統(tǒng)及應(yīng)用。在網(wǎng)站和大數(shù)據(jù)方面有著豐富的經(jīng)驗(yàn),尤其是精準(zhǔn)營(yíng)銷和數(shù)據(jù)挖掘方向。