中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >>
大數據架構和算法實現之路-電商系統的技術實戰

包郵 大數據架構和算法實現之路-電商系統的技術實戰

作者:黃申
出版社:機械工業出版社出版時間:2017-06-01
開本: 32開 頁數: 424
中 圖 價:¥55.5(7.0折) 定價  ¥79.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

大數據架構和算法實現之路-電商系統的技術實戰 版權信息

大數據架構和算法實現之路-電商系統的技術實戰 本書特色

本書介紹了一些主流技術在商業項目中的應用,包括機器學習中的分類、聚類和線性回歸,搜索引擎,推薦系統,用戶行為跟蹤,架構設計的基本理念及常用的消息和緩存機制。在這個過程中,我們有機會實踐R、Mahout、Solr、Elasticsearch、Hadoop、HBase、Hive、Flume、Kafka、Storm等系統。本書大的特色就是,從商業需求出發演變到合理的技術方案和實現,因此根據不同的應用場景、不同的數據集合、不同的進階難度,我們為讀者提供了反復溫習和加深印象的機會。

大數據架構和算法實現之路-電商系統的技術實戰 內容簡介

本書介紹了一些主流技術在商業項目中的應用,包括機器學習中的分類、聚類和線性回歸,搜索引擎,推薦系統,用戶行為跟蹤,架構設計的基本理念及常用的消息和緩存機制。在這個過程中,我們有機會實踐R、Mahout、Solr、Elasticsearch、Hadoop、HBase、Hive、Flume、Kafka、Storm等系統。本書大的特色就是,從商業需求出發演變到合理的技術方案和實現,因此根據不同的應用場景、不同的數據集合、不同的進階難度,我們為讀者提供了反復溫習和加深印象的機會。

大數據架構和算法實現之路-電商系統的技術實戰 目錄

目  錄?Contents
推薦序
前言
引子 1
**篇 支持高效的運營
第1章 方案設計和技術選型:分類 5
1.1 分類的基本概念 6
1.2 分類任務的處理流程 7
1.3 算法:樸素貝葉斯和K*近鄰 8
1.3.1 樸素貝葉斯 8
1.3.2 K*近鄰 9
1.4 分類效果評估 10
1.5 相關軟件:R和Mahout 12
1.5.1 R簡介 12
1.5.2 Mahout簡介 13
1.5.3 Hadoop簡介 14
1.6 案例實踐 17
1.6.1 實驗環境設置 17
1.6.2 中文分詞 18
1.6.3 使用R進行樸素貝葉斯分類 22
1.6.4 使用R進行K*近鄰分類 37
1.6.5 單機環境使用Mahout運行樸素貝葉斯分類 39
1.6.6 多機環境使用Mahout運行樸素貝葉斯分類 47
1.7 更多的思考 58
第2章 方案設計和技術選型:聚類 60
2.1 聚類的基本概念 60
2.2 算法:K均值和層次型聚類 61
2.2.1 K均值聚類 61
2.2.2 層次型聚類 62
2.3 聚類的效果評估 64
2.4 案例實踐 66
2.4.1 使用R進行K均值聚類 66
2.4.2 使用Mahout進行K均值聚類 69
第3章 方案設計和技術選型:因變量連續的回歸分析 74
3.1 線性回歸的基本概念 74
3.2 案例實踐 76
3.2.1 實驗環境設置 76
3.2.2 R中數據的標準化 78
3.2.3 使用R的線性回歸分析 81
第二篇為顧客發現喜歡的商品:
基礎篇
第4章 方案設計和技術選型:搜索 94
4.1 搜索引擎的基本概念 94
4.1.1 相關性 95
4.1.2 及時性 97
4.2 搜索引擎的評估 100
4.3 為什么不是數據庫 103
4.4 系統框架 104
4.4.1 離線預處理 104
4.4.2 在線查詢 107
4.5 常見的搜索引擎實現 108
4.5.1 Lucene簡介 108
4.5.2 Solr簡介 113
4.5.3 Elasticsearch簡介 120
4.6 案例實踐 123
4.6.1 實驗環境設置 123
4.6.2 基于Solr的實現 123
4.6.3 基于Elasticsearch的實現 154
4.6.4 統一的搜索API 175
第三篇為顧客發現喜歡的商品:高級篇
第5章 方案設計和技術選型:NoSQL和搜索的整合 195
5.1 問題分析 195
5.2 HBase簡介 196
5.3 結合HBase和搜索引擎 203
5.4 案例實踐 204
5.4.1 實驗環境設置 204
5.4.2 HBase的部署 205
5.4.3 HBase和搜索引擎的集成 211
第6章 方案設計和技術選型:查詢分類和搜索的整合 219
6.1 問題分析 219
6.2 結合分類器和搜索引擎 219
6.3 案例實踐 225
6.3.1 實驗環境設置 225
6.3.2 構建查詢分類器 226
6.3.3 定制化的搜索排序 229
6.3.4 整合查詢分類和定制化排序 236
第7章 方案設計和技術選型:個性化搜索 245
7.1 問題分析 245
7.2 結合用戶畫像和搜索引擎 245
7.3 案例實踐 249
7.3.1 用戶畫像的讀取 250
7.3.2 個性化搜索引擎 253
7.3.3 結果對比 260
第8章 方案設計和技術選型:搜索分片 267
8.1 問題分析 267
8.2 利用搜索的分片機制 269
8.3 案例實踐 271
8.3.1 Solr路由的實現 271
8.3.2 Elasticsearch路由的實現 278
第9章 方案設計和技術選型:搜索提示 283
9.1 問題分析 283
9.2 案例實踐:基礎方案 284
9.2.1 Solr搜索建議和拼寫糾錯的實現 284
9.2.2 Elasticsearch搜索建議和拼寫糾錯的實現 286
9.3 改進方案 291
9.4 案例實踐:改進方案 294
第10章 方案設計和技術選型:推薦 303
10.1 推薦系統的基本概念 305
10.2 推薦的核心要素 306
10.2.1 系統角色 306
10.2.2 相似度 307
10.2.3 相似度傳播框架 307
10.3 推薦系統的分類 307
10.4 混合模型 311
10.5 系統架構 312
10.6 Mahout中的推薦算法 313
10.7 電商常見的推薦系統方案 314
10.7.1 電商常見的推薦系統方案 314
10.7.2 相似度的計算 317
10.7.3 協同過濾 319
10.7.4 結果的查詢 320
10.8 案例實踐 321
10.8.1 基于內容特征的推薦 321
10.8.2 基于行為特征的推薦 341
第四篇 獲取數據,跟蹤效果
第11章 方案設計和技術選型:行為跟蹤 369
11.1 基本概念 370
11.1.1 網站的核心框架 370
11.1.2 行為數據的類型 371
11.1.3 行為數據的模式 372
11.1.4 設計理念 374
11.2 使用谷歌分析 375
11.3 自行設計之Flume、HDFS和Hive的整合 378
11.3.1 數據的收集——Flume簡介 378
11.3.2 數據的存儲——Hadoop HDFS回顧 382
11.3.3 批量數據分析——Hive簡介 383
11.3.4 Flume、HDFS和Hive的整合方案 386
11.4 自行設計之Flume、Kafka和Storm的整合 386
11.4.1 實時性數據分析之Kafka簡介 386
11.4.2 實時性數據分析之Storm簡介 388
11.4.3 Flume、Kafka和Storm的整合方案 390
11.5 案例實踐 391
11.5.1 數據模式的設計 392
11.5.2 實驗環境設置 392
11.5.3 谷歌分析實戰 394
11.5.4 自主設計實戰之Flume、HDFS和Hive的整合 401
11.5.5 自主設計實戰之Flume、Kafka和Storm的整合 410
11.6 更多的思考 424
后記 425
展開全部

大數據架構和算法實現之路-電商系統的技術實戰 作者簡介

機器學習和大數據挖掘領域的技術專家和管理者。在上海交通大學獲得計算機科學與工程博士學位,先后在微軟亞洲研究院,eBay中國研發中心,1號店和飛牛網工作。“微軟學者獎”獲得者,IBM中國首屆“ExtremeBlue天才孵化計劃”成員。有超過10年的學術創新和實際研發的經驗,成功孵化了10多項關鍵算法,發表了20多篇國際學術論文,擁有10多項國際專利及申請。目前是《計算機工程》雜志的特邀審稿專家,參與撰寫的互聯網圖書《玩轉電商》已經于2014年出版。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 山东太阳能路灯厂家-庭院灯生产厂家-济南晟启灯饰有限公司 | 船用烟火信号弹-CCS防汛救生圈-船用救生抛绳器(海威救生设备) | YJLV22铝芯铠装电缆-MYPTJ矿用高压橡套电缆-天津市电缆总厂 | 断桥铝破碎机_铝合金破碎机_废铁金属破碎机-河南鑫世昌机械制造有限公司 | 一体式钢筋扫描仪-楼板测厚仪-裂缝检测仪-泰仕特(北京) | 压滤机-洗沙泥浆处理-压泥机-山东创新华一环境工程有限公司 | 一体化预制泵站-一体化提升泵站-一体化泵站厂家-山东康威环保 | 立式矫直机_卧式矫直机-无锡金矫机械制造有限公司 | 申江储气罐厂家,储气罐批发价格,储气罐规格-上海申江压力容器有限公司(厂) | 赛尔特智能移动阳光房-阳光房厂家-赛尔特建筑科技(广东)有限公司 | 次氯酸钠厂家,涉水级次氯酸钠,三氯化铁生产厂家-淄博吉灿化工 | 滁州高低温冲击试验箱厂家_安徽高低温试验箱价格|安徽希尔伯特 | 氧化锆纤维_1800度高温退火炉_1800度高温烧结炉-南京理工宇龙新材料股份有限公司 | 破碎机锤头_耐磨锤头_合金锤头-鼎成机械一站式耐磨铸件定制服务 微型驱动系统解决方案-深圳市兆威机电股份有限公司 | 5nd音乐网|最新流行歌曲|MP3歌曲免费下载|好听的歌|音乐下载 免费听mp3音乐 | 沈阳网站建设_沈阳网站制作_沈阳网页设计-做网站就找示剑新零售 沈阳缠绕膜价格_沈阳拉伸膜厂家_沈阳缠绕膜厂家直销 | 剪刃_纵剪机刀片_分条机刀片-南京雷德机械有限公司 | 登车桥动力单元-非标液压泵站-非标液压系统-深圳市三好科技有限公司 | 棕刚玉-白刚玉厂家价格_巩义市东翔净水材料厂| 咖啡加盟-咖啡店加盟-咖啡西餐厅加盟-塞纳左岸咖啡西餐厅官网 | 无刷电机_直流无刷电机_行星减速机-佛山市藤尺机电设备有限公司 无菌检查集菌仪,微生物限度仪器-苏州长留仪器百科 | 薄壁轴承-等截面薄壁轴承生产厂家-洛阳薄壁精密轴承有限公司 | 热风机_工业热风机生产厂家上海冠顶公司提供专业热风机图片价格实惠 | 立刷【微电签pos机】-嘉联支付立刷运营中心 | 水质传感器_水质监测站_雨量监测站_水文监测站-山东水境传感科技有限公司 | 泰国试管婴儿_泰国第三代试管婴儿_泰国试管婴儿费用/多少钱_孕泰来 | 北京开源多邦科技发展有限公司官网 | 体感VRAR全息沉浸式3D投影多媒体展厅展会游戏互动-万展互动 | 远程会诊系统-手术示教系统【林之硕】医院远程医疗平台 | 铝合金风口-玻璃钢轴流风机-玻璃钢屋顶风机-德州东润空调设备有限公司 | 轴承振动测量仪电箱-轴承测振动仪器-测试仪厂家-杭州居易电气 | 手表腕表维修保养鉴定售后服务中心网点 - 名表维修保养 | bng防爆挠性连接管-定做金属防爆挠性管-依客思防爆科技 | 电销卡 防封电销卡 不封号电销卡 电话销售卡 白名单电销卡 电销系统 外呼系统 | 定硫仪,量热仪,工业分析仪,马弗炉,煤炭化验设备厂家,煤质化验仪器,焦炭化验设备鹤壁大德煤质工业分析仪,氟氯测定仪 | 铁素体测量仪/检测仪/铁素体含量测试仪-苏州圣光仪器有限公司 | 篷房|仓储篷房|铝合金篷房|体育篷房|篷房厂家-华烨建筑科技官网 知名电动蝶阀,电动球阀,气动蝶阀,气动球阀生产厂家|价格透明-【固菲阀门官网】 | 高空重型升降平台_高空液压举升平台_高空作业平台_移动式升降机-河南华鹰机械设备有限公司 | 拉力测试机|材料拉伸试验机|电子拉力机价格|万能试验机厂家|苏州皖仪实验仪器有限公司 | 流量检测仪-气密性检测装置-密封性试验仪-东莞市奥图自动化科技有限公司 | 超细粉碎机|超微气流磨|气流分级机|粉体改性设备|超微粉碎设备-山东埃尔派粉碎机厂家 |