-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應(yīng)用
-
>
決戰(zhàn)行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調(diào)優(yōu)實踐之路
-
>
第一行代碼Android
-
>
JAVA持續(xù)交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學(xué)習(xí)
大數(shù)據(jù)互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理 版權(quán)信息
- ISBN:9787115291318
- 條形碼:9787115291318 ; 978-7-115-29131-8
- 裝幀:一般膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>>
大數(shù)據(jù)互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理 本書特色
大數(shù)據(jù)時代的及時雨 全球著名數(shù)據(jù)庫技術(shù)專家*新力作 理論與實際算法實現(xiàn)并重
大數(shù)據(jù)互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理 內(nèi)容簡介
本書源自作者在斯坦福大學(xué)教授多年的“web挖掘”課程材料,主要關(guān)注大數(shù)據(jù)環(huán)境下數(shù)據(jù)挖掘的實際算法。書中分析了海量數(shù)據(jù)集數(shù)據(jù)挖掘常用的算法,介紹了目前web應(yīng)用的許多重要話題。主要內(nèi)容包括:
□ 分布式文件系統(tǒng)以及map-reduce工具;
□ 相似性搜索;
□ 數(shù)據(jù)流處理以及針對易丟失數(shù)據(jù)等特殊情況的專用處理算法;
□ 搜索引擎技術(shù),如谷歌的pagerank;
□ 頻繁項集挖掘;
□ 大規(guī)模高維數(shù)據(jù)集的聚類算法;
□ web應(yīng)用中的關(guān)鍵問題:廣告管理和推薦系統(tǒng)。
本書配套網(wǎng)http://infolab.stanford.edu/~ullman/mmds.html上提供英文版初稿以及一些課件和項目作業(yè)。
大數(shù)據(jù)互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理 目錄
1.1 數(shù)據(jù)挖掘的定義
1.1.1 統(tǒng)計建模
1.1.2 機器學(xué)習(xí)
1.1.3 建模的計算方法
1.1.4 數(shù)據(jù)匯總
1.1.5 特征抽取
1.2 數(shù)據(jù)挖掘的統(tǒng)計限制
1.2.1 整體情報預(yù)警
1.2.2 邦弗朗尼原理
1.2.3 邦弗朗尼原理的一個例子
1.2.4 習(xí)題
1.3 相關(guān)知識
1.3.1 詞語在文檔中的重要性
1.3.2 哈希函數(shù)
大數(shù)據(jù)互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理 作者簡介
Anand
Rajaraman 數(shù)據(jù)庫和Web技術(shù)領(lǐng)域權(quán)威,創(chuàng)業(yè)投資基金Cambrian聯(lián)合創(chuàng)始人,斯坦福大學(xué)計算機科學(xué)系助理教授。Rajaraman職業(yè)生涯非常成功:1996年創(chuàng)辦Junglee公司,兩年后該公司被亞馬遜以2.5億美元收購,Rajaraman被聘為亞馬遜技術(shù)總監(jiān),推動亞馬遜從一個零售商轉(zhuǎn)型為零售平臺;2000年與人合創(chuàng)Cambrian,孵化出幾個后來被谷歌收購的公司;2005年創(chuàng)辦Kosmix公司并任CEO,該公司2011年被沃爾瑪集團收購。Rajaraman生于印度,在斯坦福大學(xué)獲得計算機科學(xué)碩士和博士學(xué)位。求學(xué)期間與人合著的一篇論文榮列近20年來被引用次數(shù)最多的論文之一。博客地址http://anand.typepad.com/datawocky/。
Jeffrey David
Ullman 美國國家工程院院士,計算機科學(xué)家,斯坦福大學(xué)教授。Ullman早年在貝爾實驗室工作,之后任教于普林斯頓大學(xué),十年后加入斯坦福大學(xué)直至退休,一生的科研、著書和育人成果卓著。他是ACM會員,曾獲SIGMOD貢獻獎、Knuth獎等多項科研大獎;他是“龍書”《編譯原理》、數(shù)據(jù)庫領(lǐng)域權(quán)威指南《數(shù)據(jù)庫系統(tǒng)實現(xiàn)》的合著者;麾下多名學(xué)生成為了數(shù)據(jù)庫領(lǐng)域的專家,其中最有名的當屬谷歌創(chuàng)始人Sergey
Brin;本書第一作者也是他的得意弟子。Ullman目前任Gradiance公司CEO。
- >
人文閱讀與收藏·良友文學(xué)叢書:一天的工作
- >
【精裝繪本】畫給孩子的中國神話
- >
羅庸西南聯(lián)大授課錄
- >
我從未如此眷戀人間
- >
中國人在烏蘇里邊疆區(qū):歷史與人類學(xué)概述
- >
月亮與六便士
- >
史學(xué)評論
- >
龍榆生:詞曲概論/大家小書