中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網(wǎng) 請 | 注冊
> >>
大數(shù)據(jù)-互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理-(第2版)

包郵 大數(shù)據(jù)-互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理-(第2版)

出版社:人民郵電出版社出版時間:2015-07-01
開本: 16開 頁數(shù): 371
中 圖 價:¥44.4(5.6折) 定價  ¥79.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

大數(shù)據(jù)-互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理-(第2版) 版權(quán)信息

大數(shù)據(jù)-互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理-(第2版) 本書特色

本書由斯坦福大學“web挖掘”課程的內(nèi)容總結(jié)而成,主要關(guān)注極大規(guī)模數(shù)據(jù)的挖掘。主要內(nèi)容包括分布式文件系統(tǒng)、相似性搜索、搜索引擎技術(shù)、頻繁項集挖掘、聚類算法、廣告管理及推薦系統(tǒng)。其中相關(guān)章節(jié)有對應(yīng)的習題,以鞏固所講解的內(nèi)容。讀者更可以從網(wǎng)上獲取相關(guān)拓展材料。

大數(shù)據(jù)-互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理-(第2版) 內(nèi)容簡介

本書源自作者在斯坦福大學教授的“海量數(shù)據(jù)挖掘”(cs246: mining massive datasets)課程,第1版上市以來受到讀者廣泛歡迎和認可。這個新版本在上一版基礎(chǔ)上新增三章內(nèi)容,分別涵蓋社會網(wǎng)絡(luò)圖挖掘、降維和大規(guī)模機器學習,同時也更新了第1版的部分內(nèi)容。   眾所周知,移動互聯(lián)網(wǎng)、社交媒體、電子商務(wù)和各種傳感器的運用產(chǎn)生了超大數(shù)據(jù)集,挖掘這些數(shù)據(jù)可以提煉出有用的信息。本書以大數(shù)據(jù)環(huán)境下的數(shù)據(jù)挖掘和機器學習為重點,全面介紹了實踐中行之有效的數(shù)據(jù)處理算法,是在校學生和相關(guān)從業(yè)人員的**讀物。主要內(nèi)容包括:   分布式文件系統(tǒng)以及mapreduce工具;   相似性搜索;   數(shù)據(jù)流處理以及針對易丟失數(shù)據(jù)等特殊情況的專用處理算法;   搜索引擎技術(shù),如谷歌的pagerank;   頻繁項集挖掘;   大規(guī)模高維數(shù)據(jù)集的聚類算法;   web應(yīng)用中的關(guān)鍵問題——廣告管理和推薦系統(tǒng);   社會網(wǎng)絡(luò)圖挖掘;   降維處理,如svd分解和cur分解;   大規(guī)模機器學習。  

大數(shù)據(jù)-互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理-(第2版) 目錄


第1 章 數(shù)據(jù)挖掘基本概念
 1.1 數(shù)據(jù)挖掘的定義
  1.1.1 統(tǒng)計建模
  1.1.2 機器學習
  1.1.3 建模的計算方法
  1.1.4 數(shù)據(jù)匯總
  1.1.5 特征抽取
 1.2 數(shù)據(jù)挖掘的統(tǒng)計限制
  1.2.1 整體情報預(yù)警
  1.2.2 邦弗朗尼原理
  1.2.3 邦弗朗尼原理的一個例子
  1.2.4 習題
 1.3 相關(guān)知識
  1.3.1 詞語在文檔中的重要性
  1.3.2 哈希函數(shù)
  1.3.3 索引
  1.3.4 二級存儲器
  1.3.5 自然對數(shù)的底e
  1.3.6 冪定律
  1.3.7 習題
 1.4 本書概要
 1.5 小結(jié)
 1.6 參考文獻
第2 章 mapreduce及新軟件棧
 2.1 分布式文件系統(tǒng)
  2.1.1 計算節(jié)點的物理結(jié)構(gòu)
  2.1.2 大規(guī)模文件系統(tǒng)的結(jié)構(gòu)
 2.2 mapreduce
  2.2.1 map 任務(wù)
  2.2.2 按鍵分組
  2.2.3 reduce 任務(wù)
  2.2.4 組合器
  2.2.5 mapreduce 的執(zhí)行細節(jié)
  2.2.6 節(jié)點失效的處理
  2.2.7 習題
 2.3 使用mapreduce 的算法
  2.3.1 基于mapreduce 的矩陣-向量乘法實現(xiàn)
  2.3.2 向量v 無法放入內(nèi)存時的處理
  2.3.3 關(guān)系代數(shù)運算
  2.3.4 基于mapreduce 的選擇運算
  2.3.5 基于mapreduce 的投影運算
  2.3.6 基于mapreduce 的并、交和差運算
  2.3.7 基于mapreduce 的自然連接運算
  2.3.8 基于mapreduce 的分組和聚合運算
  2.3.9 矩陣乘法
  2.3.10 基于單步mapreduce 的矩陣乘法
  2.3.11 習題
 2.4 mapreduce 的擴展
  2.4.1 工作流系統(tǒng)
  2.4.2 mapreduce 的遞歸擴展版本
  2.4.3 pregel 系統(tǒng)
  2.4.4 習題
  2.5 通信開銷模型
  2.5.1 任務(wù)網(wǎng)絡(luò)的通信開銷
  2.5.2 時鐘時間
  2.5.3 多路連接
  2.5.4 習題
 2.6 mapreduce 復(fù)雜性理論
  2.6.1 reducer 規(guī)模及復(fù)制率
  2.6.2 一個例子:相似性連接
  2.6.3 mapreduce 問題的一個圖模型
  2.6.4 映射模式
  2.6.5 并非所有輸入都存在時的處理
  2.6.6 復(fù)制率的下界
  2.6.7 案例分析:矩陣乘法
  2.6.8 習題
 2.7 小結(jié)
 2.8 參考文獻
第3 章 相似項發(fā)現(xiàn)
 3.1 近鄰搜索的應(yīng)用
  3.1.1 集合的jaccard 相似度
  3.1.2 文檔的相似度
  3.1.3 協(xié)同過濾--一個集合相似問題
  3.1.4 習題
 3.2 文檔的shingling
  3.2.1 k-shingle
  3.2.2 shingle 大小的選擇
  3.2.3 對shingle 進行哈希
  3.2.4 基于詞的shingle
  3.2.5 習題
 3.3 保持相似度的集合摘要表示
  3.3.1 集合的矩陣表示
  3.3.2 *小哈希
  3.3.3 *小哈希及jaccard 相似度
  3.3.4 *小哈希簽名
  3.3.5 *小哈希簽名的計算
  3.3.6 習題
  3.4 文檔的局部敏感哈希算法
  3.4.1 面向*小哈希簽名的lsh
  3.4.2 行條化策略的分析
  3.4.3 上述技術(shù)的綜合
  3.4.4 習題
 3.5 距離測度
  3.5.1 距離測度的定義
  3.5.2 歐氏距離
  3.5.3 jaccard 距離
  3.5.4 余弦距離
  3.5.5 編輯距離
  3.5.6 海明距離
  3.5.7 習題
 3.6 局部敏感函數(shù)理論
  3.6.1 局部敏感函數(shù)
  3.6.2 面向jaccard 距離的局部敏感函數(shù)族
  3.6.3 局部敏感函數(shù)族的放大處理
  3.6.4 習題
 3.7 面向其他距離測度的lsh 函數(shù)族
  3.7.1 面向海明距離的lsh 函數(shù)族
  3.7.2 隨機超平面和余弦距離
  3.7.3 梗概
  3.7.4 面向歐氏距離的lsh 函數(shù)族
  3.7.5 面向歐氏空間的更多l(xiāng)sh函數(shù)族
  3.7.6 習題
 3.8 lsh 函數(shù)的應(yīng)用
  3.8.1 實體關(guān)聯(lián)
  3.8.2 一個實體關(guān)聯(lián)的例子
  3.8.3 記錄匹配的驗證
  3.8.4 指紋匹配
  3.8.5 適用于指紋匹配的lsh函數(shù)族
  3.8.6 相似新聞報道檢測
  3.8.7 習題
 3.9 面向高相似度的方法
  3.9.1 相等項發(fā)現(xiàn)
  3.9.2 集合的字符串表示方法
  3.9.3 基于長度的過濾
  3.9.4 前綴索引
  3.9.5 位置信息的使用
  3.9.6 使用位置和長度信息的索引
  3.9.7 習題
 3.10 小結(jié)
 3.11 參考文獻
第4 章 數(shù)據(jù)流挖掘
 4.1 流數(shù)據(jù)模型
  4.1.1 一個數(shù)據(jù)流管理系統(tǒng)
  4.1.2 流數(shù)據(jù)源的例子
  4.1.3 流查詢
  4.1.4 流處理中的若干問題
 4.2 流當中的數(shù)據(jù)抽樣
  4.2.1 一個富于啟發(fā)性的例子
  4.2.2 代表性樣本的獲取
  4.2.3 一般的抽樣問題
  4.2.4 樣本規(guī)模的變化
  4.2.5 習題
 4.3 流過濾
  4.3.1 一個例子
  4.3.2 布隆過濾器
  4.3.3 布隆過濾方法的分析
  4.3.4 習題
  4.4 流中獨立元素的數(shù)目統(tǒng)計
  4.4.1 獨立元素計數(shù)問題
  4.4.2 fm 算法
  4.4.3 組合估計
  4.4.4 空間需求
  4.4.5 習題
 4.5 矩估計
  4.5.1 矩定義
  4.5.2 二階矩估計的ams 算法
  4.5.3 ams 算法有效的原因
  4.5.4 更高階矩的估計
  4.5.5 無限流的處理
  4.5.6 習題
 4.6 窗口內(nèi)的計數(shù)問題
  4.6.1 精確計數(shù)的開銷
  4.6.2 dgim 算法
  4.6.3 dgim 算法的存儲需求
  4.6.4 dgim 算法中的查詢應(yīng)答
  4.6.5 dgim 條件的保持
  4.6.6 降低錯誤率
  4.6.7 窗口內(nèi)計數(shù)問題的擴展
  4.6.8 習題
 4.7 衰減窗口
  4.7.1 *常見元素問題
  4.7.2 衰減窗口的定義
  4.7.3 *流行元素的發(fā)現(xiàn)
 4.8 小結(jié)
 4.9 參考文獻
第5 章 鏈接分析
 5.1 pagerank
  5.1.1 早期的搜索引擎及詞項作弊
  5.1.2 pagerank 的定義
  5.1.3 web 結(jié)構(gòu)
  5.1.4 避免終止點
  5.1.5 采集器陷阱及"抽稅"法
  5.1.6 pagerank 在搜索引擎中的使用
  5.1.7 習題
 5.2 pagerank 的快速計算
  5.2.1 轉(zhuǎn)移矩陣的表示
  5.2.2 基于mapreduce 的pagerank迭代計算
  5.2.3 結(jié)果向量合并時的組合器使用
  5.2.4 轉(zhuǎn)移矩陣中塊的表示
  5.2.5 其他高效的pagerank 迭代方法
  5.2.6 習題
 5.3 面向主題的pagerank
  5.3.1 動機
  5.3.2 有偏
 ……
第6章頻繁項集
第7章聚類
第8章web廣告
第9章推薦系統(tǒng)
第10章社會網(wǎng)絡(luò)圖挖掘
第11章降維處理
第12章大規(guī)模機器學習
展開全部

大數(shù)據(jù)-互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理-(第2版) 相關(guān)資料

這本書已經(jīng)在大數(shù)據(jù)處理行業(yè)獲得很好的口碑,書籍偏向理論方向,但是沒有枯燥晦澀的數(shù)學公式與冗長的計算過程,反而另辟蹊徑地從實例出發(fā)來介紹相關(guān)挖掘技術(shù)的理論基礎(chǔ)以及發(fā)展愿景,可以說是數(shù)據(jù)分析師必備的參考書。
  書的內(nèi)容源于作者在斯坦福大學執(zhí)教的課程材料,對算法研討得很深入,非常有價值!
  結(jié)構(gòu)編排清晰,是我想要的具體講述數(shù)據(jù)挖掘?qū)嵱眉夹g(shù)和算法的經(jīng)典書!

大數(shù)據(jù)-互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理-(第2版) 作者簡介

Jure Leskovec 斯坦福大學計算機科學系助理教授,研究方向是大型社交和信息網(wǎng)絡(luò)的數(shù)據(jù)挖掘。他的研究成果獲得了很多獎項,如Microsoft Research Faculty Fellowship、Alfred P. Sloan Fellowship和Okawa Foundation Fellowship,還獲得了很多最佳論文獎,同時也被《紐約時報》《華爾街日報》《華盛頓郵報》《麻省理工科技評論》《連線》、NBC、BBC等流行的社會媒體刊載。他還創(chuàng)建了斯坦福網(wǎng)絡(luò)分析平臺。   Anand Rajaraman 數(shù)據(jù)庫和Web技術(shù)領(lǐng)域權(quán)威,創(chuàng)業(yè)投資基金Cambrian聯(lián)合創(chuàng)始人,斯坦福大學計算機科學系助理教授。Rajaraman的職業(yè)生涯非常成功:1996年創(chuàng)辦Junglee公司,兩年后被亞馬遜以2.5億美元收購,Rajaraman被聘為亞馬遜技術(shù)總監(jiān),推動亞馬遜從一個零售商轉(zhuǎn)型為零售平臺;2000年與人合創(chuàng)Cambrian,孵化出幾個后來被谷歌收購的公司;2005年創(chuàng)辦Kosmix公司并任CEO,該公司于2011年被沃爾瑪集團收購,Rajaraman被聘為沃爾瑪負責全球電子商務(wù)業(yè)務(wù)的高級副總裁。Rajaraman生于印度,在斯坦福大學獲得計算機科學碩士和博士學位。求學期間與人合著的一篇論文榮列近20年來被引用次數(shù)最多的論文之一。Twitter賬號是@anand_raj。   Jeffrey David Ullman 美國國家工程院院士,計算機科學家。早年在貝爾實驗室工作,之后任教于普林斯頓大學,十年后加入斯坦福大學直至退休,一生的科研、著書和育人成果卓著。他是ACM會員,曾獲SIGMOD創(chuàng)新獎、高德納獎、馮諾依曼獎等多項科研大獎;他是“龍書”《編譯原理》、數(shù)據(jù)庫名著《數(shù)據(jù)庫系統(tǒng)實現(xiàn)》等多部經(jīng)典著作的合著者;麾下多名學生成為了數(shù)據(jù)庫領(lǐng)域的專家,其中最有名的當屬谷歌創(chuàng)始人Sergey Brin;本書第二作者也是他的得意弟子。Ullman目前任Gradiance公司CEO。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
返回頂部
中圖網(wǎng)
在線客服
主站蜘蛛池模板: 自动气象站_农业气象站_超声波气象站_防爆气象站-山东万象环境科技有限公司 | 东莞爱加真空科技有限公司-进口真空镀膜机|真空镀膜设备|Polycold维修厂家 | 全自动在线分板机_铣刀式在线分板机_曲线分板机_PCB分板机-东莞市亿协自动化设备有限公司 | 购买舔盐、舔砖、矿物质盐压块机,鱼饵、鱼饲料压块机--请到杜甫机械 | 外贸网站建设-外贸网站设计制作开发公司-外贸独立站建设【企术】 | 丹佛斯变频器-Danfoss战略代理经销商-上海津信变频器有限公司 | 北京网站建设首页,做网站选【优站网】,专注北京网站建设,北京网站推广,天津网站建设,天津网站推广,小程序,手机APP的开发。 | 医疗仪器模块 健康一体机 多参数监护仪 智慧医疗仪器方案定制 血氧监护 心电监护 -朗锐慧康 | (中山|佛山|江门)环氧地坪漆,停车场地板漆,车库地板漆,聚氨酯地板漆-中山永旺地坪漆厂家 | PSI渗透压仪,TPS酸度计,美国CHAI PCR仪,渗透压仪厂家_价格,微生物快速检测仪-华泰和合(北京)商贸有限公司 | 土壤养分检测仪|土壤水分|土壤紧实度测定仪|土壤墒情监测系统-土壤仪器网 | 志高装潢官网-苏州老房旧房装修改造-二手房装修翻新 | 真空干燥烘箱_鼓风干燥箱 _高低温恒温恒湿试验箱_光照二氧化碳恒温培养箱-上海航佩仪器 | 塑料撕碎机_编织袋撕碎机_废纸撕碎机_生活垃圾撕碎机_废铁破碎机_河南鑫世昌机械制造有限公司 | 小型玉石雕刻机_家用玉雕机_小型万能雕刻机_凡刻雕刻机官网 | pbootcms网站模板|织梦模板|网站源码|jquery建站特效-html5模板网 | 安徽合肥项目申报咨询公司_安徽合肥高新企业项目申报_安徽省科技项目申报代理 | 仪器仪表网 - 永久免费的b2b电子商务平台 | 网站优化公司_SEO优化_北京关键词百度快速排名-智恒博网络 | 书信之家_书信标准模板范文大全| 科箭WMS仓库管理软件-TMS物流管理系统-科箭SaaS云服务 | 水上浮桥-游艇码头-浮动码头-游船码头-码瑞纳游艇码头工程 | 安驭邦官网-双向万能直角铣头,加工中心侧铣头,角度头[厂家直销] 闸阀_截止阀_止回阀「生产厂家」-上海卡比阀门有限公司 | 成都亚克力制品,PVC板,双色板雕刻加工,亚克力门牌,亚克力标牌,水晶字雕刻制作-零贰捌广告 | 政府园区专业委托招商平台_助力企业选址项目快速落地_东方龙商务集团 | 大型多片锯,圆木多片锯,方木多片锯,板材多片锯-祥富机械有限公司 | 高博医疗集团上海阿特蒙医院| 小程序开发公司_APP开发多少钱_软件开发定制_微信小程序制作_客户销售管理软件-济南小溪畅流网络科技有限公司 | 电主轴,车床电磨头,变频制动电机-博山鸿达特种电机 | 通信天线厂家_室分八木天线_对数周期天线_天线加工厂_林创天线源头厂家 | 蒜肠网-动漫,二次元,COSPLAY,漫展以及收藏型模型,手办,玩具的新媒体.(原变形金刚变迷TF圈) | 锂电混合机-新能源混合机-正极材料混料机-高镍,三元材料混料机-负极,包覆混合机-贝尔专业混合混料搅拌机械系统设备厂家 | 帽子厂家_帽子工厂_帽子定做_义乌帽厂_帽厂_制帽厂 | 电销卡 防封电销卡 不封号电销卡 电话销售卡 白名单电销卡 电销系统 外呼系统 | 翅片管散热器价格_钢制暖气片报价_钢制板式散热器厂家「河北冀春暖气片有限公司」 | 五轴加工中心_数控加工中心_铝型材加工中心-罗威斯 | 杭州货架订做_组合货架公司_货位式货架_贯通式_重型仓储_工厂货架_货架销售厂家_杭州永诚货架有限公司 | 99文库_实习生实用的范文资料文库站 | 上海小程序开发-小程序制作-上海小程序定制开发公司-微信商城小程序-上海咏熠 | 威廉希尔WilliamHill·足球(中国)体育官方网站| 权威废金属|废塑料|废纸|废铜|废钢价格|再生资源回收行情报价中心-中废网 |