中圖網

>

網絡與數據通信

>

通信

大數據架構和算法實現之路-電商系統的技術實戰

包郵大數據架構和算法實現之路-電商系統的技術實戰

作者：黃申

出版社：機械工業出版社出版時間：2017-06-01

開本： 32開 頁數： 424

本類榜單：計算機/網絡銷量榜

中圖價:¥55.5(7.0折) 定價 ~~¥79.0~~ 登錄后可看到會員價

加入購物車收藏

開年大促， 全場包郵

?新疆、西藏除外

本類五星書更多>

>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用

全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用

¥14.4¥45
>
決戰行測5000題(言語理解與表達)

決戰行測5000題(言語理解與表達)

¥44.1¥88
>
軟件性能測試.分析與調優實踐之路

軟件性能測試.分析與調優實踐之路

¥56.2¥69
>
第一行代碼Android

第一行代碼Android

¥55.4¥99
>
JAVA持續交付

JAVA持續交付

¥58.1¥119
>
EXCEL最強教科書(完全版)(全彩印刷)

EXCEL最強教科書(完全版)(全彩印刷)

¥31.1¥69.9
>
深度學習

深度學習

¥92.4¥168

商品詳情
商品評論(0條)

中圖價:¥55.5 加入購物車

版權信息
本書特色
內容簡介
目錄
作者簡介

大數據架構和算法實現之路-電商系統的技術實戰版權信息

ISBN：9787111569695
條形碼：9787111569695 ; 978-7-111-56969-5
裝幀：暫無
冊數：暫無
重量：暫無
所屬分類：
計算機/網絡
>
網絡與數據通信
>
通信

大數據架構和算法實現之路-電商系統的技術實戰本書特色

本書介紹了一些主流技術在商業項目中的應用，包括機器學習中的分類、聚類和線性回歸，搜索引擎，推薦系統，用戶行為跟蹤，架構設計的基本理念及常用的消息和緩存機制。在這個過程中，我們有機會實踐R、Mahout、Solr、Elasticsearch、Hadoop、HBase、Hive、Flume、Kafka、Storm等系統。本書大的特色就是，從商業需求出發演變到合理的技術方案和實現，因此根據不同的應用場景、不同的數據集合、不同的進階難度，我們為讀者提供了反復溫習和加深印象的機會。

大數據架構和算法實現之路-電商系統的技術實戰內容簡介

本書介紹了一些主流技術在商業項目中的應用，包括機器學習中的分類、聚類和線性回歸，搜索引擎，推薦系統，用戶行為跟蹤，架構設計的基本理念及常用的消息和緩存機制。在這個過程中，我們有機會實踐R、Mahout、Solr、Elasticsearch、Hadoop、HBase、Hive、Flume、Kafka、Storm等系統。本書大的特色就是，從商業需求出發演變到合理的技術方案和實現，因此根據不同的應用場景、不同的數據集合、不同的進階難度，我們為讀者提供了反復溫習和加深印象的機會。

大數據架構和算法實現之路-電商系統的技術實戰目錄

目　　錄?Contents
推薦序
前言
引子 1
**篇　支持高效的運營
第1章　方案設計和技術選型：分類 5
1.1　分類的基本概念 6
1.2　分類任務的處理流程 7
1.3　算法：樸素貝葉斯和K*近鄰 8
1.3.1　樸素貝葉斯 8
1.3.2　K*近鄰 9
1.4　分類效果評估 10
1.5　相關軟件：R和Mahout 12
1.5.1　R簡介 12
1.5.2　Mahout簡介 13
1.5.3　Hadoop簡介 14
1.6　案例實踐 17
1.6.1　實驗環境設置 17
1.6.2　中文分詞 18
1.6.3　使用R進行樸素貝葉斯分類 22
1.6.4　使用R進行K*近鄰分類 37
1.6.5　單機環境使用Mahout運行樸素貝葉斯分類 39
1.6.6　多機環境使用Mahout運行樸素貝葉斯分類 47
1.7　更多的思考 58
第2章　方案設計和技術選型：聚類 60
2.1　聚類的基本概念 60
2.2　算法：K均值和層次型聚類 61
2.2.1　K均值聚類 61
2.2.2　層次型聚類 62
2.3　聚類的效果評估 64
2.4　案例實踐 66
2.4.1　使用R進行K均值聚類 66
2.4.2　使用Mahout進行K均值聚類 69
第3章　方案設計和技術選型：因變量連續的回歸分析 74
3.1　線性回歸的基本概念 74
3.2　案例實踐 76
3.2.1　實驗環境設置 76
3.2.2　R中數據的標準化 78
3.2.3　使用R的線性回歸分析 81
第二篇為顧客發現喜歡的商品：
基礎篇
第4章　方案設計和技術選型：搜索 94
4.1　搜索引擎的基本概念 94
4.1.1　相關性 95
4.1.2　及時性 97
4.2　搜索引擎的評估 100
4.3　為什么不是數據庫 103
4.4　系統框架 104
4.4.1　離線預處理 104
4.4.2　在線查詢 107
4.5　常見的搜索引擎實現 108
4.5.1　Lucene簡介 108
4.5.2　Solr簡介 113
4.5.3　Elasticsearch簡介 120
4.6　案例實踐 123
4.6.1　實驗環境設置 123
4.6.2　基于Solr的實現 123
4.6.3　基于Elasticsearch的實現 154
4.6.4　統一的搜索API 175
第三篇為顧客發現喜歡的商品：高級篇
第5章　方案設計和技術選型：NoSQL和搜索的整合 195
5.1　問題分析 195
5.2　HBase簡介 196
5.3　結合HBase和搜索引擎 203
5.4　案例實踐 204
5.4.1　實驗環境設置 204
5.4.2　HBase的部署 205
5.4.3　HBase和搜索引擎的集成 211
第6章　方案設計和技術選型：查詢分類和搜索的整合 219
6.1　問題分析 219
6.2　結合分類器和搜索引擎 219
6.3　案例實踐 225
6.3.1　實驗環境設置 225
6.3.2　構建查詢分類器 226
6.3.3　定制化的搜索排序 229
6.3.4　整合查詢分類和定制化排序 236
第7章　方案設計和技術選型：個性化搜索 245
7.1　問題分析 245
7.2　結合用戶畫像和搜索引擎 245
7.3　案例實踐 249
7.3.1　用戶畫像的讀取 250
7.3.2　個性化搜索引擎 253
7.3.3　結果對比 260
第8章　方案設計和技術選型：搜索分片 267
8.1　問題分析 267
8.2　利用搜索的分片機制 269
8.3　案例實踐 271
8.3.1　Solr路由的實現 271
8.3.2　Elasticsearch路由的實現 278
第9章　方案設計和技術選型：搜索提示 283
9.1　問題分析 283
9.2　案例實踐：基礎方案 284
9.2.1　Solr搜索建議和拼寫糾錯的實現 284
9.2.2　Elasticsearch搜索建議和拼寫糾錯的實現 286
9.3　改進方案 291
9.4　案例實踐：改進方案 294
第10章　方案設計和技術選型：推薦 303
10.1　推薦系統的基本概念 305
10.2　推薦的核心要素 306
10.2.1　系統角色 306
10.2.2　相似度 307
10.2.3　相似度傳播框架 307
10.3　推薦系統的分類 307
10.4　混合模型 311
10.5　系統架構 312
10.6　Mahout中的推薦算法 313
10.7　電商常見的推薦系統方案 314
10.7.1　電商常見的推薦系統方案 314
10.7.2　相似度的計算 317
10.7.3　協同過濾 319
10.7.4　結果的查詢 320
10.8　案例實踐 321
10.8.1　基于內容特征的推薦 321
10.8.2　基于行為特征的推薦 341
第四篇　獲取數據，跟蹤效果
第11章　方案設計和技術選型：行為跟蹤 369
11.1　基本概念 370
11.1.1　網站的核心框架 370
11.1.2　行為數據的類型 371
11.1.3　行為數據的模式 372
11.1.4　設計理念 374
11.2　使用谷歌分析 375
11.3　自行設計之Flume、HDFS和Hive的整合 378
11.3.1　數據的收集——Flume簡介 378
11.3.2　數據的存儲——Hadoop HDFS回顧 382
11.3.3　批量數據分析——Hive簡介 383
11.3.4　Flume、HDFS和Hive的整合方案 386
11.4　自行設計之Flume、Kafka和Storm的整合 386
11.4.1　實時性數據分析之Kafka簡介 386
11.4.2　實時性數據分析之Storm簡介 388
11.4.3　Flume、Kafka和Storm的整合方案 390
11.5　案例實踐 391
11.5.1　數據模式的設計 392
11.5.2　實驗環境設置 392
11.5.3　谷歌分析實戰 394
11.5.4　自主設計實戰之Flume、HDFS和Hive的整合 401
11.5.5　自主設計實戰之Flume、Kafka和Storm的整合 410
11.6　更多的思考 424
后記 425

展開全部

大數據架構和算法實現之路-電商系統的技術實戰作者簡介

機器學習和大數據挖掘領域的技術專家和管理者。在上海交通大學獲得計算機科學與工程博士學位，先后在微軟亞洲研究院，eBay中國研發中心，1號店和飛牛網工作。“微軟學者獎”獲得者，IBM中國首屆“ExtremeBlue天才孵化計劃”成員。有超過10年的學術創新和實際研發的經驗，成功孵化了10多項關鍵算法，發表了20多篇國際學術論文，擁有10多項國際專利及申請。目前是《計算機工程》雜志的特邀審稿專家，參與撰寫的互聯網圖書《玩轉電商》已經于2014年出版。

商品評論(0條)

寫書評賺書幣

暫無評論……

書友推薦

>
中國人在烏蘇里邊疆區:歷史與人類學概述
中國人在烏蘇里邊疆區:歷史與人類學概述
[蘇]阿爾謝尼耶夫著，劉宇譯
¥21.6~~¥48.0~~
>
人文閱讀與收藏·良友文學叢書:一天的工作
人文閱讀與收藏·良友文學叢書:一天的工作
魯迅
¥15.7~~¥45.8~~
>
我與地壇
我與地壇
史鐵生
¥16.4~~¥28.0~~
>
【精裝繪本】畫給孩子的中國神話
【精裝繪本】畫給孩子的中國神話
施英巍
¥18.6~~¥55.0~~
>
巴金－再思錄
巴金－再思錄
巴金
¥15.7~~¥46.0~~
>
隨園食單
隨園食單
袁枚
¥18.2~~¥48.0~~
>
上帝之肋:男人的真實旅程
上帝之肋:男人的真實旅程
[美] 羅伯特·布萊著，田國力/盧文戈譯
¥20.2~~¥35.0~~
>
我從未如此眷戀人間
我從未如此眷戀人間
史鐵生/汪曾祺
¥20.5~~¥49.8~~

本類暢銷

副本

李婷主編

¥30.6~~¥78~~
不良情緒應急處理包--孤獨感

中圖網

¥12.9~~¥30~~
不良情緒應急處理包--精神內耗

中圖網

¥12.9~~¥30~~
孩子、家庭和外部世界

唐納德·溫尼科特

¥17.8~~¥56~~
北魏政治史(二)

張金龍著

¥26.2~~¥70~~
北魏政治史(四)

張金龍著

¥24.4~~¥65~~

中图网(原中国图书网)：网上书店，尾货特色书店，30万种特价书低至2折！

包郵大數據架構和算法實現之路-電商系統的技術實戰

大數據架構和算法實現之路-電商系統的技術實戰版權信息

大數據架構和算法實現之路-電商系統的技術實戰本書特色

大數據架構和算法實現之路-電商系統的技術實戰內容簡介

大數據架構和算法實現之路-電商系統的技術實戰目錄

大數據架構和算法實現之路-電商系統的技術實戰作者簡介

中國人在烏蘇里邊疆區:歷史與人類學概述

人文閱讀與收藏·良友文學叢書:一天的工作

我與地壇

【精裝繪本】畫給孩子的中國神話

巴金－再思錄

隨園食單

上帝之肋:男人的真實旅程

我從未如此眷戀人間

副本

不良情緒應急處理包--孤獨感

不良情緒應急處理包--精神內耗

孩子、家庭和外部世界

北魏政治史(二)

北魏政治史(四)

熊千佳昆蟲記

百年夢憶:梁實秋人生自述

時間停止的那一天

邊城-插圖本

張學良人格圖譜

連科六短篇-短篇經典文庫

包郵 大數據架構和算法實現之路-電商系統的技術實戰

大數據架構和算法實現之路-電商系統的技術實戰 版權信息

大數據架構和算法實現之路-電商系統的技術實戰 本書特色

大數據架構和算法實現之路-電商系統的技術實戰 內容簡介

大數據架構和算法實現之路-電商系統的技術實戰 目錄

大數據架構和算法實現之路-電商系統的技術實戰 作者簡介

包郵大數據架構和算法實現之路-電商系統的技術實戰

大數據架構和算法實現之路-電商系統的技術實戰版權信息

大數據架構和算法實現之路-電商系統的技術實戰本書特色

大數據架構和算法實現之路-電商系統的技術實戰內容簡介

大數據架構和算法實現之路-電商系統的技術實戰目錄

大數據架構和算法實現之路-電商系統的技術實戰作者簡介