中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網(wǎng) 請(qǐng) | 注冊(cè)
> >>
Alink權(quán)威指南:基于Flink的機(jī)器學(xué)習(xí)實(shí)例入門(Java)

包郵 Alink權(quán)威指南:基于Flink的機(jī)器學(xué)習(xí)實(shí)例入門(Java)

作者:楊旭
出版社:電子工業(yè)出版社出版時(shí)間:2021-10-01
開(kāi)本: 其他 頁(yè)數(shù): 472
中 圖 價(jià):¥73.0(4.9折) 定價(jià)  ¥149.0 登錄后可看到會(huì)員價(jià)
加入購(gòu)物車 收藏
開(kāi)年大促, 全場(chǎng)包郵
?新疆、西藏除外
溫馨提示:5折以下圖書主要為出版社尾貨,大部分為全新(有塑封/無(wú)塑封),個(gè)別圖書品相8-9成新、切口
有劃線標(biāo)記、光盤等附件不全詳細(xì)品相說(shuō)明>>
本類五星書更多>

Alink權(quán)威指南:基于Flink的機(jī)器學(xué)習(xí)實(shí)例入門(Java) 版權(quán)信息

Alink權(quán)威指南:基于Flink的機(jī)器學(xué)習(xí)實(shí)例入門(Java) 本書特色

賈揚(yáng)清作序。Alink創(chuàng)始人力作,用實(shí)例引導(dǎo)上手,提供源代碼,直接解決問(wèn)題《Alink權(quán)威指南:基于Flink的機(jī)器學(xué)習(xí)實(shí)例入門》是Alink創(chuàng)始人楊旭老師的一本心血力作。它不僅集合了作者對(duì)Flink與Alink框架的深度觀察與分析,還集合了眾多學(xué)習(xí)者在學(xué)習(xí)中遇到的難點(diǎn)、疑點(diǎn)問(wèn)題,作者在書中均一一剖析,并給合常見(jiàn)的實(shí)例進(jìn)行詳盡的說(shuō)明,使讀者能夠毫無(wú)障礙地入門解決工作中的問(wèn)題。 不僅如此,本書還提供了完整的源代碼,讀者在個(gè)人計(jì)算機(jī)中就能直接嘗試、驗(yàn)證書中的方法和算法。書中所介紹的是均是業(yè)界正在使用的工具,支持分布式計(jì)算處理海量的數(shù)據(jù)、支持流式數(shù)據(jù)的場(chǎng)景,同時(shí)機(jī)器學(xué)習(xí)流程及模型還可以方便地嵌入用戶的應(yīng)用系統(tǒng)或預(yù)測(cè)服務(wù)中。Alink將眾多的機(jī)器學(xué)習(xí)算法以標(biāo)準(zhǔn)組件的方式結(jié)合在一起,力圖使對(duì)機(jī)器學(xué)習(xí)感興趣的業(yè)務(wù)工程師可以迅速將這些算法和生產(chǎn)數(shù)據(jù)集結(jié)合在一起,驗(yàn)證效果,進(jìn)行參數(shù)的調(diào)優(yōu),并*終將這些算法嵌入業(yè)務(wù)流程當(dāng)中。 ——賈揚(yáng)清 阿里巴巴集團(tuán)副總裁、阿里巴巴開(kāi)源技術(shù)委員會(huì)負(fù)責(zé)人Apache?Flink作為新一代大數(shù)據(jù)計(jì)算引擎,憑借其流批一體以及高效的迭代計(jì)算能力,不僅能夠利用SQL對(duì)海量數(shù)據(jù)進(jìn)行實(shí)時(shí)分析,還能夠在機(jī)器學(xué)習(xí)領(lǐng)域進(jìn)行包括特征工程、模型訓(xùn)練、驗(yàn)證和推理在內(nèi)的全鏈路計(jì)算。Alink在Apache Flink強(qiáng)大計(jì)算能力的基礎(chǔ)上,封裝了一套實(shí)時(shí)離線一體化的機(jī)器學(xué)習(xí)算法庫(kù),并在阿里巴巴集團(tuán)內(nèi)部進(jìn)行了大量驗(yàn)證。通過(guò)學(xué)習(xí)Alink技術(shù),算法人員可以快速搭建起業(yè)界強(qiáng)大的機(jī)器學(xué)習(xí)算法平臺(tái)。 ——王峰 Apache?Flink中文社區(qū)發(fā)起人、阿里巴巴開(kāi)源大數(shù)據(jù)平臺(tái)負(fù)責(zé)人Apache?Flink被大家熟知的往往是其流計(jì)算的能力,其實(shí)在設(shè)計(jì)之初Flink還有一個(gè)重要的特性——迭代計(jì)算。Alink正是利用Apache?Flink迭代計(jì)算能力構(gòu)建的高效機(jī)器學(xué)習(xí)算法庫(kù),?把算法和大數(shù)據(jù)處理無(wú)縫結(jié)合起來(lái),大大提高了智能算法的研發(fā)效率,幫助企業(yè)實(shí)現(xiàn)了更多業(yè)務(wù)智能化場(chǎng)景的落地。 ——林偉 阿里巴巴研究員、阿里巴巴機(jī)器學(xué)習(xí)平臺(tái)PAI負(fù)責(zé)人

Alink權(quán)威指南:基于Flink的機(jī)器學(xué)習(xí)實(shí)例入門(Java) 內(nèi)容簡(jiǎn)介

全書圍繞Alink(阿里在Flink基礎(chǔ)上做的開(kāi)源版本)的展開(kāi),以實(shí)例為主闡述Alink的使用。 ?以機(jī)器學(xué)習(xí)的知識(shí)架構(gòu)將各個(gè)章節(jié)串聯(lián)起來(lái),每個(gè)章節(jié)配合實(shí)例,用戶更容易理解和入手嘗試。 ?數(shù)據(jù)會(huì)采用讀者能免費(fèi)下載的數(shù)據(jù)集,在加上Alink本身是開(kāi)源的、免費(fèi)的。用戶試用起來(lái)沒(méi)有成本。 ?實(shí)例實(shí)現(xiàn)的源代碼,準(zhǔn)備放在Alink開(kāi)源git上,大家容易看到,可以直接下載,代碼旁邊會(huì)有實(shí)體書的介紹 ?以機(jī)器學(xué)習(xí)的知識(shí)架構(gòu)將各個(gè)章節(jié)串聯(lián)起來(lái),每個(gè)章節(jié)配合實(shí)例,用戶更容易理解和入手嘗試。 ?數(shù)據(jù)會(huì)采用讀者能免費(fèi)下載的數(shù)據(jù)集,在加上Alink本身是開(kāi)源的、免費(fèi)的。用戶試用起來(lái)沒(méi)有成本。 ?實(shí)例實(shí)現(xiàn)的源代碼,準(zhǔn)備放在Alink開(kāi)源git上,大家容易看到,可以直接下載,代碼旁邊會(huì)有實(shí)體書的介紹

Alink權(quán)威指南:基于Flink的機(jī)器學(xué)習(xí)實(shí)例入門(Java) 目錄

目  錄



第1章 Alink快速上手 1
1.1 Alink是什么 1
1.2 免費(fèi)下載、安裝 1
1.3 Alink的功能 2
1.3.1 豐富的算法庫(kù) 2
1.3.2 多樣的使用體驗(yàn) 3
1.3.3 與SparkML的對(duì)比 3
1.4 關(guān)于數(shù)據(jù)和代碼 4
1.5 簡(jiǎn)單示例 5
1.5.1 數(shù)據(jù)的讀/寫與顯示 5
1.5.2 批式訓(xùn)練和批式預(yù)測(cè) 7
1.5.3 流式處理和流式預(yù)測(cè) 9
1.5.4 定義Pipeline,簡(jiǎn)化操作 10
1.5.5 嵌入預(yù)測(cè)服務(wù)系統(tǒng) 12
第2章 系統(tǒng)概況與核心概念 14
2.1 基本概念 14
2.2 批式任務(wù)與流式任務(wù) 15
2.3 Alink=A+link 18
2.3.1 BatchOperator和StreamOperator 19
2.3.2 link方式是批式算法/流式算法的通用使用方式 20
2.3.3 link的簡(jiǎn)化 23
2.3.4 組件的主輸出與側(cè)輸出 23
2.4 Pipeline與PipelineModel 24
2.4.1 概念和定義 24
2.4.2 深入介紹 25
2.5 觸發(fā)Alink任務(wù)的執(zhí)行 28
2.6 模型信息顯示 29
2.7 文件系統(tǒng)與數(shù)據(jù)庫(kù) 34
2.8 Schema String 36
第3章 文件系統(tǒng)與數(shù)據(jù)文件 38
3.1 文件系統(tǒng)簡(jiǎn)介 38
3.1.1 本地文件系統(tǒng) 39
3.1.2 Hadoop文件系統(tǒng) 41
3.1.3 阿里云OSS文件系統(tǒng) 43
3.2 數(shù)據(jù)文件的讀入與導(dǎo)出 45
3.2.1 CSV格式 47
3.2.2 TSV、LibSVM、Text格式 53
3.2.3 AK格式 56
第4章 數(shù)據(jù)庫(kù)與數(shù)據(jù)表 60
4.1 簡(jiǎn)介 60
4.1.1 Catalog的基本操作 60
4.1.2 Source和Sink組件 61
4.2 Hive示例 62
4.3 Derby示例 65
4.4 MySQL示例 67
第5章 支持Flink SQL 70
5.1 基本操作 70
5.1.1 注冊(cè) 70
5.1.2 運(yùn)行 71
5.1.3 內(nèi)置函數(shù) 74
5.1.4 用戶定義函數(shù) 74
5.2 簡(jiǎn)化操作 75
5.2.1 單表操作 76
5.2.2 兩表的連接(JOIN)操作 80
5.2.3 兩表的集合操作 82
5.3 深入介紹Table Environment 86
5.3.1 注冊(cè)數(shù)據(jù)表名 87
5.3.2 撤銷數(shù)據(jù)表名 88
5.3.3 掃描已注冊(cè)的表 89
第6章 用戶定義函數(shù)(UDF/UDTF) 90
6.1 用戶定義標(biāo)量函數(shù)(UDF) 90
6.1.1 示例數(shù)據(jù)及問(wèn)題 91
6.1.2 UDF的定義 91
6.1.3 使用UDF處理批式數(shù)據(jù) 92
6.1.4 使用UDF處理流式數(shù)據(jù) 93
6.2 用戶定義表值函數(shù)(UDTF) 95
6.2.1 示例數(shù)據(jù)及問(wèn)題 95
6.2.2 UDTF的定義 96
6.2.3 使用UDTF處理批式數(shù)據(jù) 96
6.2.4 使用UDTF處理流式數(shù)據(jù) 99
第7章 基本數(shù)據(jù)處理 101
7.1 采樣 101
7.1.1 取“前”N個(gè)數(shù)據(jù) 102
7.1.2 隨機(jī)采樣 102
7.1.3 加權(quán)采樣 104
7.1.4 分層采樣 105
7.2 數(shù)據(jù)劃分 106
7.3 數(shù)值尺度變換 108
7.3.1 標(biāo)準(zhǔn)化 109
7.3.2 MinMaxScale 111
7.3.3 MaxAbsScale 112
7.4 向量的尺度變換 113
7.4.1 StandardScale、MinMaxScale、MaxAbsScale 113
7.4.2 正則化 115
7.5 缺失值填充 116
第8章 線性二分類模型 119
8.1 線性模型的基礎(chǔ)知識(shí) 119
8.1.1 損失函數(shù) 119
8.1.2 經(jīng)驗(yàn)風(fēng)險(xiǎn)與結(jié)構(gòu)風(fēng)險(xiǎn) 121
8.1.3 線性模型與損失函數(shù) 122
8.1.4 邏輯回歸與線性支持向量機(jī)(Linear SVM) 123
8.2 二分類評(píng)估方法 125
8.2.1 基本指標(biāo) 126
8.2.2 綜合指標(biāo) 128
8.2.3 評(píng)估曲線 131
8.3 數(shù)據(jù)探索 136
8.3.1 基本統(tǒng)計(jì) 138
8.3.2 相關(guān)性 140
8.4 訓(xùn)練集和測(cè)試集 144
8.5 邏輯回歸模型 145
8.6 線性SVM模型 147
8.7 模型評(píng)估 149
8.8 特征的多項(xiàng)式擴(kuò)展 153
8.9 因子分解機(jī) 157
第9章 樸素貝葉斯模型與決策樹(shù)模型 160
9.1 樸素貝葉斯模型 160
9.2 決策樹(shù)模型 162
9.2.1 決策樹(shù)的分裂指標(biāo)定義 165
9.2.2 常用的決策樹(shù)算法 167
9.2.3 指標(biāo)計(jì)算示例 169
9.2.4 分類樹(shù)與回歸樹(shù) 172
9.2.5 經(jīng)典的決策樹(shù)示例 173
9.3 數(shù)據(jù)探索 176
9.4 使用樸素貝葉斯方法 179
9.5 蘑菇分類的決策樹(shù) 185
第10章 特征的轉(zhuǎn)化 191
10.1 整體流程 195
10.1.1 特征啞元化 197
10.1.2 特征的重要性 198
10.2 減少模型特征的個(gè)數(shù) 200
10.3 離散特征轉(zhuǎn)化 202
10.3.1 獨(dú)熱編碼 202
10.3.2 特征哈希 204
第11章 構(gòu)造新特征 207
11.1 數(shù)據(jù)探索 208
11.2 思路 210
11.2.1 用戶和品牌的各種特征 211
11.2.2 二分類模型訓(xùn)練 212
11.3 計(jì)算訓(xùn)練集 213
11.3.1 原始數(shù)據(jù)劃分 213
11.3.2 計(jì)算特征 214
11.3.3 計(jì)算標(biāo)簽 222
11.4 正負(fù)樣本配比 224
11.5 決策樹(shù) 226
11.6 集成學(xué)習(xí) 227
11.6.1 Bootstrap aggregating 228
11.6.2 Boosting 229
11.6.3 隨機(jī)森林與GBDT 232
11.7 使用隨機(jī)森林算法 233
11.8 使用GBDT算法 234
第12章 從二分類到多分類 235
12.1 多分類模型評(píng)估方法 235
12.1.1 綜合指標(biāo) 237
12.1.2 關(guān)于每個(gè)標(biāo)簽值的二分類指標(biāo) 238
12.1.3 Micro、Macro、Weighted計(jì)算的指標(biāo) 239
12.2 數(shù)據(jù)探索 241
12.3 使用樸素貝葉斯進(jìn)行多分類 244
12.4 二分類器組合 246
12.5 Softmax算法 249
12.6 多層感知器分類器 253
第13章 常用多分類算法 256
13.1 數(shù)據(jù)準(zhǔn)備 256
13.1.1 讀取MNIST數(shù)據(jù)文件 257
13.1.2 稠密向量與稀疏向量 258
13.1.3 標(biāo)簽值的統(tǒng)計(jì)信息 261
13.2 Softmax算法 262
13.3 二分類器組合 264
13.4 多層感知器分類器 265
13.5 決策樹(shù)與隨機(jī)森林 267
13.6 K*近鄰算法 270
第14章 在線學(xué)習(xí) 273
14.1 整體流程 273
14.2 數(shù)據(jù)準(zhǔn)備 275
14.3 特征工程 277
14.4 特征工程處理數(shù)據(jù) 279
14.5 在線訓(xùn)練 280
14.6 模型過(guò)濾 283
第15章 回歸的由來(lái) 286
15.1 平均數(shù) 287
15.2 向平均數(shù)方向的回歸 288
15.3 線性回歸 289
第16章 常用回歸算法 292
16.1 回歸模型的評(píng)估指標(biāo) 292
16.2 數(shù)據(jù)探索 294
16.3 線性回歸 297
16.4 決策樹(shù)與隨機(jī)森林 300
16.5 GBDT回歸 301
第17章 常用聚類算法 303
17.1 聚類評(píng)估指標(biāo) 304
17.1.1 基本評(píng)估指標(biāo) 304
17.1.2 基于標(biāo)簽值的評(píng)估指標(biāo) 306
17.2 K-Means聚類 308
17.2.1 算法簡(jiǎn)介 308
17.2.2 K-Means實(shí)例 309
17.3 高斯混合模型 314
17.3.1 算法介紹 314
17.3.2 GMM實(shí)例 316
17.4 二分K-Means聚類 317
17.5 基于經(jīng)緯度的聚類 320
第18章 批式與流式聚類 324
18.1 稠密向量與稀疏向量 324
18.2 使用聚類模型預(yù)測(cè)流式數(shù)據(jù) 326
18.3 流式聚類 329
第19章 主成分分析 331
19.1 主成分的含義 333
19.2 兩種計(jì)算方式 337
19.3 在聚類方面的應(yīng)用 339
19.4 在分類方面的應(yīng)用 343
第20章 超參數(shù)搜索 347
20.1 示例一:嘗試正則系數(shù) 348
20.2 示例二:搜索GBDT超參數(shù) 349
20.3 示例三:*佳聚類個(gè)數(shù) 350
第21章 文本分析 353
21.1 數(shù)據(jù)探索 353
21.2 分詞 355
21.2.1 中文分詞 356
21.2.2 Tokenizer和RegexTokenizer 359
21.3 詞頻統(tǒng)計(jì) 363
21.4 單詞的區(qū)分度 365
21.5 抽取關(guān)鍵詞 367
21.5.1 原理簡(jiǎn)介 367
21.5.2 示例 369
21.6 文本相似度 371
21.6.1 文本成對(duì)比較 372
21.6.2 *相似的TopN 375
21.7 主題模型 387
21.7.1 LDA模型 388
21.7.2 新聞的主題模型 390
21.7.3 主題與原始分類的對(duì)比 392
21.8 組件使用小結(jié) 396
第22章 單詞向量化 398
22.1 單詞向量預(yù)訓(xùn)練模型 399
22.1.1 加載模型 399
22.1.2 查找相似的單詞 400
22.1.3 單詞向量 402
22.2 單詞映射為向量 406
第23章 情感分析 412
23.1 使用提供的特征 413
23.1.1 使用樸素貝葉斯方法 416
23.1.2 使用邏輯回歸算法 419
23.2 如何提取特征 423
23.3 構(gòu)造更多特征 426
23.4 模型保存與預(yù)測(cè) 430
23.4.1 批式/流式預(yù)測(cè)任務(wù) 430
23.4.2 嵌入式預(yù)測(cè) 431
第24章 構(gòu)建推薦系統(tǒng) 433
24.1 與推薦相關(guān)的組件介紹 434
24.2 常用推薦算法 437
24.2.1 協(xié)同過(guò)濾 437
24.2.2 交替*小二乘法 438
24.3 數(shù)據(jù)探索 439
24.4 評(píng)分預(yù)測(cè) 444
24.5 根據(jù)用戶推薦影片 446
24.6 計(jì)算相似影片 452
24.7 根據(jù)影片推薦用戶 454
24.8 計(jì)算相似用戶 457
展開(kāi)全部

Alink權(quán)威指南:基于Flink的機(jī)器學(xué)習(xí)實(shí)例入門(Java) 作者簡(jiǎn)介

2004年獲南開(kāi)大學(xué)數(shù)學(xué)博士學(xué)位;隨后在南開(kāi)大學(xué)信息學(xué)院從事博士后研究工作;2006年加入微軟亞洲研究院,進(jìn)行符號(hào)計(jì)算、大規(guī)模矩陣計(jì)算及機(jī)器學(xué)習(xí)算法研究;2010年加入阿里巴巴,從事大數(shù)據(jù)相關(guān)的統(tǒng)計(jì)和機(jī)器學(xué)習(xí)算法研發(fā)。著有《重構(gòu)大數(shù)據(jù)統(tǒng)計(jì)》《機(jī)器學(xué)習(xí)在線》等。

商品評(píng)論(0條)
暫無(wú)評(píng)論……
書友推薦
編輯推薦
返回頂部
中圖網(wǎng)
在線客服
主站蜘蛛池模板: 篮球架_乒乓球台_足球门_校园_竞技体育器材_厂家_价格-沧州浩然体育器材有限公司 | 睿婕轻钢别墅_钢结构别墅_厂家设计施工报价 | 水厂自动化-水厂控制系统-泵站自动化|控制系统-闸门自动化控制-济南华通中控科技有限公司 | 海峰资讯 - 专注装饰公司营销型网站建设和网络营销培训 | 胶原检测试剂盒,弹性蛋白检测试剂盒,类克ELISA试剂盒,阿达木单抗ELISA试剂盒-北京群晓科苑生物技术有限公司 | 陕西安玻璃自动感应门-自动重叠门-磁悬浮平开门厂家【捷申达门业】 | 安德建奇火花机-阿奇夏米尔慢走丝|高维|发那科-北京杰森柏汇 | 常州翔天实验仪器厂-恒温振荡器-台式恒温振荡器-微量血液离心机 恒温恒湿箱(药品/保健品/食品/半导体/细菌)-兰贝石(北京)科技有限公司 | 东莞办公家具厂家直销-美鑫【免费3D效果图】全国办公桌/会议桌定制 | 密封无忧网 _ 专业的密封产品行业信息网 | 欧景装饰设计工程有限公司-无锡欧景装饰官网 | 深圳市超时尚职业培训学校,培训:月嫂,育婴,养老,家政;化妆,美容,美发,美甲. | 耐酸碱胶管_耐腐蚀软管总成_化学品输送软管_漯河利通液压科技耐油耐磨喷砂软管|耐腐蚀化学软管 | pbt头梳丝_牙刷丝_尼龙毛刷丝_PP塑料纤维合成毛丝定制厂_广州明旺 | 广州印刷厂_广州彩印厂-广州艺彩印务有限公司 | 福建省教师资格证-福建教师资格证考试网 | 宏源科技-房地产售楼系统|线上开盘系统|售楼管理系统|线上开盘软件 | 长沙一级消防工程公司_智能化弱电_机电安装_亮化工程专业施工承包_湖南公共安全工程有限公司 | 警方提醒:赣州约炮论坛真的安全吗?2025年新手必看的网络交友防坑指南 | 丹佛斯变频器-Danfoss战略代理经销商-上海津信变频器有限公司 | LINK FASHION 童装·青少年装展| 【MBA备考网】-2024年工商管理硕士MBA院校/报考条件/培训/考试科目/提前面试/考试/学费-MBA备考网 | IP检测-检测您的IP质量| 胶泥瓷砖胶,轻质粉刷石膏,嵌缝石膏厂家,腻子粉批发,永康家德兴,永康市家德兴建材厂 | 小程序开发公司_APP开发多少钱_软件开发定制_微信小程序制作_客户销售管理软件-济南小溪畅流网络科技有限公司 | 【铜排折弯机,钢丝折弯成型机,汽车发泡钢丝折弯机,线材折弯机厂家,线材成型机,铁线折弯机】贝朗折弯机厂家_东莞市贝朗自动化设备有限公司 | 合肥宠物店装修_合肥宠物美容院装修_合肥宠物医院设计装修公司-安徽盛世和居装饰 | 数字展示在线_数字展示行业门户网站| 「银杏树」银杏树行情价格_银杏树种植_山东程锦园林 | [官网]叛逆孩子管教_戒网瘾学校_全封闭问题青少年素质教育_新起点青少年特训学校 | 全温度恒温培养摇床-大容量-立式-远红外二氧化碳培养箱|南荣百科 | 中国在职研究生招生信息网 | 世界箱包品牌十大排名,女包小众轻奢品牌推荐200元左右,男包十大奢侈品牌排行榜双肩,学生拉杆箱什么品牌好质量好 - Gouwu3.com | 餐饮加盟网_特色餐饮加盟店_餐饮连锁店加盟 | 步进_伺服_行星减速机,微型直流电机,大功率直流电机-淄博冠意传动机械 | 尊享蟹太太美味,大闸蟹礼卡|礼券|礼盒在线预订-蟹太太官网 | 塑胶跑道施工-硅pu篮球场施工-塑胶网球场建造-丙烯酸球场材料厂家-奥茵 | 色油机-色母机-失重|称重式混料机-称重机-米重机-拌料机-[东莞同锐机械]精密计量科技制造商 | 洗地机_全自动洗地机_手推式洗地机【上海滢皓环保】 | T恤衫定做,企业文化衫制作订做,广告T恤POLO衫定制厂家[源头工厂]-【汉诚T恤定制网】 | 不锈钢/气体/液体玻璃转子流量计(防腐,选型,规格)-常州天晟热工仪表有限公司【官网】 |