-
>
全國(guó)計(jì)算機(jī)等級(jí)考試最新真考題庫(kù)模擬考場(chǎng)及詳解·二級(jí)MSOffice高級(jí)應(yīng)用
-
>
決戰(zhàn)行測(cè)5000題(言語(yǔ)理解與表達(dá))
-
>
軟件性能測(cè)試.分析與調(diào)優(yōu)實(shí)踐之路
-
>
第一行代碼Android
-
>
JAVA持續(xù)交付
-
>
EXCEL最強(qiáng)教科書(shū)(完全版)(全彩印刷)
-
>
深度學(xué)習(xí)
流數(shù)據(jù)分析技術(shù) 版權(quán)信息
- ISBN:9787563559152
- 條形碼:9787563559152 ; 978-7-5635-5915-2
- 裝幀:一般膠版紙
- 冊(cè)數(shù):暫無(wú)
- 重量:暫無(wú)
- 所屬分類:>
流數(shù)據(jù)分析技術(shù) 內(nèi)容簡(jiǎn)介
本書(shū)是大數(shù)據(jù)方向本科生的專業(yè)選修課教材。教材包括綜述性內(nèi)容、技術(shù)性內(nèi)容和實(shí)踐性內(nèi)容。其中, 綜述性內(nèi)容包括大數(shù)據(jù)技術(shù)綜述、流數(shù)據(jù)分析技術(shù)綜述。技術(shù)性內(nèi)容包括流數(shù)據(jù)采集技術(shù)、流數(shù)據(jù)處理技術(shù)、流數(shù)據(jù)存儲(chǔ)技術(shù)、流數(shù)據(jù)分析技術(shù)等。
流數(shù)據(jù)分析技術(shù) 目錄
1.1 大數(shù)據(jù)
1.1.1 大數(shù)據(jù)的發(fā)展
1.1.2 大數(shù)據(jù)的概念
1.1.3 大數(shù)據(jù)思維
1.2 流數(shù)據(jù)
1.2.1 流數(shù)據(jù)的場(chǎng)景
1.2.2 流數(shù)據(jù)的特點(diǎn)
1.2.3 流數(shù)據(jù)的概念
1.3 流數(shù)據(jù)處理
1.3.1 批處理模型
1.3.2 流式處理模型
1.3.3 流式處理與窗口模型
1.3.4 流式處理與概要結(jié)構(gòu)
1.3.5 批處理與流式處理的對(duì)比
1.4 流數(shù)據(jù)分析
1.4.1 頻繁項(xiàng)挖掘算法
1.4.2 聚類算法
1.4.3 分類算法
1.4.4 回歸算法
1.5 流數(shù)據(jù)機(jī)器學(xué)習(xí)
1.6 小結(jié)
本章知識(shí)點(diǎn)
擴(kuò)展閱讀
習(xí)題1
第2章 流數(shù)據(jù)概要結(jié)構(gòu)構(gòu)建技術(shù)
2.1 流數(shù)據(jù)處理的概要結(jié)構(gòu)
2.2 抽樣概要結(jié)構(gòu)
2.2.1 抽樣
2.2.2 伯努利抽樣
2.2.3 水庫(kù)抽樣
2.2.4 簡(jiǎn)明抽樣
2.3 草圖概要結(jié)構(gòu)
2.3.1 草圖
2.3.2 計(jì)數(shù)草圖
2.3.3 增廣草圖
2.3.4 布隆過(guò)濾器
2.3.5 FM基數(shù)估計(jì)草圖
2.4 小波概要結(jié)構(gòu)
2.5 直方圖概要結(jié)構(gòu)
2.5.1 直方圖
2.5.2 等寬直方圖
2.6 小結(jié)
本章知識(shí)點(diǎn)
擴(kuò)展閱讀
習(xí)題2
第3章 流數(shù)據(jù)頻繁模式挖掘技術(shù)
3.1 頻繁模式挖掘問(wèn)題的定義
3.2 不同窗口模型的頻繁模式挖掘
3.3 頻繁項(xiàng)挖掘算法
3.3.1 黏性抽樣算法
3.3.2 KPS算法
3.4 頻繁模式挖掘算法
3.4.1 有損計(jì)數(shù)算法
3.4.2 有損計(jì)數(shù)算法擴(kuò)展
3.5 頻繁模式挖掘的其他相關(guān)問(wèn)題
3.6 小結(jié)
本章知識(shí)點(diǎn)
擴(kuò)展閱讀
習(xí)題3
第4章 流數(shù)據(jù)聚類分析技術(shù)
4.1 聚類算法
4.2 流數(shù)據(jù)聚類的評(píng)價(jià)
4.2.1 內(nèi)部度量
4.2.2 外部度量
4.3 不同窗口模型的聚類分析
4.4 基于劃分的流數(shù)據(jù)聚類算法
4.4.1 STREAM算法
4.4.2 K-Center算法
4.5 基于層次的流數(shù)據(jù)聚類算法
4.6 基于密度的流數(shù)據(jù)聚類算法
4.7 基于網(wǎng)格的流數(shù)據(jù)聚類算法
4.8 其他流數(shù)據(jù)聚類算法
4.8.1 K-Median算法
4.8.2 BIRCH算法
4.9 小結(jié)
本章知識(shí)點(diǎn)
擴(kuò)展閱讀
習(xí)題4
第5章 流數(shù)據(jù)分類分析技術(shù)
5.1 。分類算法
5.2 流數(shù)據(jù)分類的評(píng)價(jià)
5.2.1 誤差估計(jì)
5.2.2 性能評(píng)價(jià)指標(biāo)
5.2.3 統(tǒng)計(jì)顯著性
5.2.4 成本度量
5.3 基于貝葉斯的分類算法
5.4 基于決策樹(shù)的分類算法
5.4.1 快速?zèng)Q策樹(shù)算法
5.4.2 概念自適應(yīng)快速?zèng)Q策樹(shù)算法
5.5 其他流數(shù)據(jù)分類算法
5.5.1 VFDTc和UFFT算法
5.5.2 Hoeffding自適應(yīng)樹(shù)算法
5.6 小結(jié)
本章知識(shí)點(diǎn)
擴(kuò)展閱讀
習(xí)題5
第6章 流數(shù)據(jù)學(xué)習(xí)與時(shí)間序列分析技術(shù)
6.1 時(shí)間序列
6.1.1 時(shí)間序列的分類與特征
6.1.2 時(shí)間序列的表示與擬合
6.1.3 時(shí)間序列的預(yù)測(cè)
6.2 在線學(xué)習(xí)模型
6.3 流數(shù)據(jù)學(xué)習(xí)評(píng)價(jià)
6.3.1 誤差
6.3.2 Regret界
6.4 模型學(xué)習(xí)算法
6.4.1 ARIMA算法
6.4.2 在線ARIMA算法
6.5 實(shí)例學(xué)習(xí)算法
6.5.1 嶺回歸與LASSO回歸
6.5.2 FIMT算法
6.5.3 AMRules算法
6.6 *優(yōu)化算法
6.6.1 SGD算法
6.6.2 FTRL算法
6.7 小結(jié)
本章知識(shí)點(diǎn)
擴(kuò)展閱讀
習(xí)題6
第7章 流數(shù)據(jù)處理模型與框架
7.1 流數(shù)據(jù)處理計(jì)算模型
7.2 流計(jì)算的狀態(tài)與一致性
7.2.1 流計(jì)算的狀態(tài)
7.2.2 流計(jì)算的一致性
7.3 流計(jì)算處理中的時(shí)間
7.4 流計(jì)算實(shí)現(xiàn)框架
7.5 Storm流處理框架
7.5.1 基于流的處理拓?fù)浣Y(jié)構(gòu)
7.5.2 記錄級(jí)容錯(cuò)
7.5.3 Storm的系統(tǒng)架構(gòu)
7.6 Spark流處理框架
7.6.1 基于RDD的微批處理結(jié)構(gòu)
7.6.2 基于RDD依賴的容錯(cuò)
7.6.3 Spark的系統(tǒng)架構(gòu)
7.7 Flink流處理框架
7.7.1 基于流水線的處理結(jié)構(gòu)
7.7.2 基于分布式快照的容錯(cuò)
7.7.3 Flink的系統(tǒng)架構(gòu)
7.8 小結(jié)
本章知識(shí)點(diǎn)
擴(kuò)展閱讀
習(xí)題7
參考文獻(xiàn)
流數(shù)據(jù)分析技術(shù) 作者簡(jiǎn)介
李靜林,博士、副教授,2004年獲得北京郵電大學(xué)計(jì)算機(jī)應(yīng)用技術(shù)博士學(xué)位。現(xiàn)任北京郵電大學(xué)網(wǎng)絡(luò)與交換技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室交換與智能控制研究中心主任。主要研究方向?yàn)橐苿?dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、車聯(lián)網(wǎng)等融合網(wǎng)絡(luò)智能與服務(wù)計(jì)算。
- >
上帝之肋:男人的真實(shí)旅程
- >
羅庸西南聯(lián)大授課錄
- >
我從未如此眷戀人間
- >
史學(xué)評(píng)論
- >
人文閱讀與收藏·良友文學(xué)叢書(shū):一天的工作
- >
中國(guó)人在烏蘇里邊疆區(qū):歷史與人類學(xué)概述
- >
推拿
- >
苦雨齋序跋文-周作人自編集