掃一掃
關注中圖網
官方微博
本類五星書更多>
-
>
闖進數學世界――探秘歷史名題
-
>
中醫基礎理論
-
>
當代中國政府與政治(新編21世紀公共管理系列教材)
-
>
高校軍事課教程
-
>
思想道德與法治(2021年版)
-
>
毛澤東思想和中國特色社會主義理論體系概論(2021年版)
-
>
中醫內科學·全國中醫藥行業高等教育“十四五”規劃教材
白話大數據與機器學習 版權信息
- ISBN:9787111538479
- 條形碼:9787111538479 ; 978-7-111-53847-9
- 裝幀:暫無
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
白話大數據與機器學習 本書特色
本書將涵蓋以下比較重要的挖掘和分析知識點:概率、統計和分布、多維向量空間、回歸、聚類、分類、關聯分析、協同過濾、文本挖掘、神經網絡。同時,講解了大數據相關的人才需求、行業情況、大數據變現與產品發布、系統調優等讀者需要了解的內容。
白話大數據與機器學習 內容簡介
本書將涵蓋以下比較重要的挖掘和分析知識點:概率、統計和分布、多維向量空間、回歸、聚類、分類、關聯分析、協同過濾、文本挖掘、神經網絡。同時,講解了大數據相關的人才需求、行業情況、大數據變現與產品發布、系統調優等讀者需要了解的內$容。
白話大數據與機器學習 目錄
目 錄?contents前 言第1章 大數據產業 11.1 大數據產業現狀 11.2 對大數據產業的理解 21.3 大數據人才 31.3.1 供需失衡 31.3.2 人才方向 31.3.3 環節和工具 51.3.4 門檻障礙 61.4 小結 8第2章 步入數據之門 92.1 什么是數據 92.2 什么是信息 102.3 什么是算法 122.4 統計、概率和數據挖掘 132.5 什么是商業智能 132.6 小結 14第3章 排列組合與古典概型 153.1 排列組合的概念 163.1.1 公平的決斷——扔硬幣 163.1.2 非古典概型 173.2 排列組合的應用示例 183.2.1 雙色球彩票 183.2.2 購車搖號 203.2.3 德州撲克 213.3 小結 25第4章 統計與分布 274.1 加和值、平均值和標準差 274.1.1 加和值 284.1.2 平均值 294.1.3 標準差 304.2 加權均值 324.2.1 混合物定價 324.2.2 決策權衡 344.3 眾數、中位數 354.3.1 眾數 364.3.2 中位數 374.4 歐氏距離 374.5 曼哈頓距離 394.6 同比和環比 414.7 抽樣 434.8 高斯分布 454.9 泊松分布 494.10 伯努利分布 524.11 小結 54第5章 指標 555.1 什么是指標 555.2 指標化運營 585.2.1 指標的選擇 585.2.2 指標體系的構建 625.3 小結 63第6章 信息論 646.1 信息的定義 646.2 信息量 656.2.1 信息量的計算 656.2.2 信息量的理解 666.3 香農公式 686.4 熵 706.4.1 熱力熵 706.4.2 信息熵 726.5 小結 75第7章 多維向量空間 767.1 向量和維度 767.1.1 信息冗余 777.1.2 維度 797.2 矩陣和矩陣計算 807.3 數據立方體 837.4 上卷和下鉆 857.5 小結 86第8章 回歸 878.1 線性回歸 878.2 擬合 888.3 殘差分析 948.4 過擬合 998.5 欠擬合 1008.6 曲線擬合轉化為線性擬合 1018.7 小結 104第9章 聚類 1059.1 k-means算法 1069.2 有趣模式 1099.3 孤立點 1109.4 層次聚類 1109.5 密度聚類 1139.6 聚類評估 1169.6.1 聚類趨勢 1179.6.2 簇數確定 1199.6.3 測定聚類質量 1219.7 小結 124第10章 分類 12510.1 樸素貝葉斯 12610.1.1 天氣的預測 12810.1.2 疾病的預測 13010.1.3 小結 13210.2 決策樹歸納 13310.2.1 樣本收集 13510.2.2 信息增益 13610.2.3 連續型變量 13710.3 隨機森林 14010.4 隱馬爾可夫模型 14110.4.1 維特比算法 14410.4.2 前向算法 15110.5 支持向量機svm 15410.5.1 年齡和好壞 15410.5.2 “下刀”不容易 15710.5.3 距離有多遠 15810.5.4 n維度空間中的距離 15910.5.5 超平面怎么畫 16010.5.6 分不開怎么辦 16010.5.7 示例 16310.5.8 小結 16410.6 遺傳算法 16410.6.1 進化過程 16410.6.2 算法過程 16510.6.3 背包問題 16510.6.4 極大值問題 17310.7 小結 181第11章 關聯分析 18311.1 頻繁模式和apriori算法 18411.1.1 頻繁模式 18411.1.2 支持度和置信度 18511.1.3 經典的apriori算法 18711.1.4 求出所有頻繁模式 19011.2 關聯分析與相關性分析 19211.3 稀有模式和負模式 19311.4 小結 194第12章 用戶畫像 19512.1 標簽 19512.2 畫像的方法 19612.2.1 結構化標簽 19612.2.2 非結構化標簽 19812.3 利用用戶畫像 20312.3.1 割裂型用戶畫像 20312.3.2 緊密型用戶畫像 20412.3.3 到底“像不像” 20412.4 小結 205第13章 推薦算法 20613.1 推薦思路 20613.1.1 貝葉斯分類 20613.1.2 利用搜索記錄 20713.2 user-based cf 20913.3 item-based cf 21113.4 優化問題 21513.5 小結 217第14章 文本挖掘 21814.1 文本挖掘的領域 21814.2 文本分類 21914.2.1 rocchio算法 22014.2.2 樸素貝葉斯算法 22314.2.3 k-近鄰算法 22514.2.4 支持向量機svm算法 22614.3 小結 227第15章 人工神經網絡 22815.1 人的神經網絡 22815.1.1 神經網絡結構 22915.1.2 結構模擬 23015.1.3 訓練與工作 23115.2 fann庫簡介 23315.3 常見的神經網絡 23515.4 bp神經網絡 23515.4.1 結構和原理 23615.4.2 訓練過程 23715.4.3 過程解釋 24015.4.4 示例 24015.5 玻爾茲曼機 24415.5.1 退火模型 24415.5.2 玻爾茲曼機 24515.6 卷積神經網絡 24715.6.1 卷積 24815.6.2 圖像識別 24915.7 深度學習 25515.8 小結 256第16章 大數據框架簡介 25716.1 著名的大數據框架 25716.2 hadoop框架 25816.2.1 mapreduce原理 25916.2.2 安裝hadoop 26116.2.3 經典的wordcount 26416.3 spark 框架 26916.3.1 安裝spark 27016.3.2 使用scala計算wordcount 27116.4 分布式列存儲框架 27216.5 prestodb——神奇的cli 27316.5.1 presto為什么那么快 27316.5.2 安裝presto 27416.6 小結 277第17章 系統架構和調優 27817.1 速度——資源的配置 27817.1.1 思路一:邏輯層面的優化 27917.1.2 思路二:容器層面的優化 27917.1.3 思路三:存儲結構層面的優化 28017.1.4 思路四:環節層面的優化 28017.1.5 資源不足 28117.2 穩定——資源的可用 28217.2.1 借助云服務 28217.2.2 鎖分散 28217.2.3 排隊 28317.2.4 謹防“雪崩” 28317.3 小結 285第18章 數據解讀與數據的價值 28618.1 運營指標 28618.1.1 互聯網類型公司常用指標 28718.1.2 注意事項 28818.2 ab測試 28918.2.1 網頁測試 29018.2.2 方案測試 29018.2.3 灰度發布 29218.2.4 注意事項 29318.3 數據可視化 29518.3.1 圖表 29518.3.2 表格 29918.4 多維度——大數據的靈魂 29918.4.1 多大算大 29918.4.2 大數據網絡 30018.4.3 去中心化才能活躍 30118.4.4 數據會過剩嗎 30218.5 數據變現的場景 30318.5.1 數據價值的衡量的討論 30318.5.2 場景1:征信數據 30718.5.3 場景2:宏觀數據 30818.5.4 場景3:畫像數據 30918.6 小結 310附錄a vmware workstation的安裝 311附錄b centos虛擬機的安裝方法 314附錄c python語言簡介 318附錄d scikit-learn庫簡介 323附錄e fann for python安裝 324附錄f 群眾眼中的大數據 325寫作花絮 327參考文獻 329
展開全部
書友推薦
- >
詩經-先民的歌唱
- >
我與地壇
- >
大紅狗在馬戲團-大紅狗克里弗-助人
- >
二體千字文
- >
李白與唐代文化
- >
人文閱讀與收藏·良友文學叢書:一天的工作
- >
煙與鏡
- >
龍榆生:詞曲概論/大家小書
本類暢銷