工業(yè)大數(shù)據(jù)分析算法實(shí)戰(zhàn)/大數(shù)據(jù)與智能+產(chǎn)教融合叢書 版權(quán)信息
- ISBN:9787111709619
- 條形碼:9787111709619 ; 978-7-111-70961-9
- 裝幀:一般膠版紙
- 冊(cè)數(shù):暫無(wú)
- 重量:暫無(wú)
- 所屬分類:>
工業(yè)大數(shù)據(jù)分析算法實(shí)戰(zhàn)/大數(shù)據(jù)與智能+產(chǎn)教融合叢書 本書特色
所謂“工業(yè)大數(shù)據(jù)分析”,其實(shí)就是在工業(yè)生產(chǎn)過(guò)程、工業(yè)設(shè)備、流水線等一系列復(fù)雜系統(tǒng)中,通過(guò)通過(guò)分析現(xiàn)象去看本質(zhì)的過(guò)程。比如設(shè)備出了問(wèn)題,像是風(fēng)電渦輪不轉(zhuǎn)了,流水線卡住了,機(jī)器堵了,生產(chǎn)的產(chǎn)品突然出現(xiàn)了好多殘次品,曾經(jīng)的工程師都是憑經(jīng)驗(yàn),或者觀察,通過(guò)現(xiàn)象去看本質(zhì)。而現(xiàn)在,因?yàn)楝F(xiàn)代化的工廠或者工業(yè)設(shè)備的每一個(gè)環(huán)節(jié)都有各種電子數(shù)據(jù)的記錄,而數(shù)據(jù)分析師則可以通過(guò)這些數(shù)據(jù)的統(tǒng)計(jì),通過(guò)合適的算法和模式,去通過(guò)計(jì)算機(jī)發(fā)現(xiàn)這些設(shè)備出現(xiàn)的故障和問(wèn)題。這就是數(shù)字化時(shí)代的故障分析技術(shù)——數(shù)據(jù)挺多,但是怎么用才對(duì),這是一個(gè)數(shù)據(jù)分析師個(gè)人技術(shù)實(shí)力的體現(xiàn)。現(xiàn)在太多的數(shù)據(jù)分析師,只停留在“看”數(shù)據(jù),而不是“分析”數(shù)據(jù)的水平上——知道從哪入手去分析,比分析計(jì)算本身更重要。而這本書就是教你“從哪開始分析,怎么站在機(jī)器的角度去分析機(jī)器的數(shù)據(jù)”。作者是工業(yè)大數(shù)據(jù)分析領(lǐng)域的首席科學(xué)家,20多年一直從事數(shù)據(jù)分析,很多大型機(jī)器設(shè)備的疑難雜癥在他手里迎刃而解,作者語(yǔ)言簡(jiǎn)練,字字珠璣,對(duì)每個(gè)算法都給出了自己*直白的解釋,這些干貨卻積攢了70萬(wàn)字! 從事工業(yè)領(lǐng)域的技術(shù)人員,都應(yīng)該讀一讀田博士的這本著作。
工業(yè)大數(shù)據(jù)分析算法實(shí)戰(zhàn)/大數(shù)據(jù)與智能+產(chǎn)教融合叢書 內(nèi)容簡(jiǎn)介
本書以工業(yè)大數(shù)據(jù)的特點(diǎn)和需求為牽引,闡述了工業(yè)大數(shù)據(jù)分析的算法與實(shí)現(xiàn)機(jī)制,使具有工科背景讀者建立起數(shù)據(jù)思維,靈活利用數(shù)據(jù)分析算法進(jìn)行實(shí)際問(wèn)題的建模,并實(shí)現(xiàn)分析項(xiàng)目高效迭代與落地。具體主題覆蓋了工業(yè)大數(shù)據(jù)分析工程思維和軟件棧,工業(yè)數(shù)據(jù)的數(shù)據(jù)探索,預(yù)處理方法和常用機(jī)器學(xué)習(xí)算法,故障診斷、質(zhì)量?jī)?yōu)化、流程優(yōu)化的分析算法,專家規(guī)則捕獲方法,工業(yè)數(shù)據(jù)分析工程等內(nèi)容。
工業(yè)大數(shù)據(jù)分析算法實(shí)戰(zhàn)/大數(shù)據(jù)與智能+產(chǎn)教融合叢書 目錄
叢書序一
叢書序二
前言
第1章 工業(yè)大數(shù)據(jù)分析概覽 1
1.1 工業(yè)大數(shù)據(jù)分析的范疇與特點(diǎn) 1
1.1.1 數(shù)據(jù)分析的范疇 1
1.1.2 典型分析主題 2
1.1.3 工業(yè)數(shù)據(jù)分析的特點(diǎn) 4
1.1.4 數(shù)據(jù)分析的典型手段 5
1.2.1 CRISP-DM簡(jiǎn)介 9
1.2.2 分析課題的執(zhí)行路徑 10
1.3.1 腳本語(yǔ)言軟件 12
1.3.2 圖形化桌面軟件 13
1.3.3 云端分析軟件 14
1.4.1 分析算法理解的維度與路徑 15
1.4.2 必讀圖書 16
1.4.3 分析算法背后的樸素思想 18
1.4.4 工程化思維 20
2.1 數(shù)據(jù)操作基礎(chǔ) 23
2.1.1 數(shù)據(jù)框的基本操作 23
2.1.2 數(shù)據(jù)可視化 24
2.2.1 cumsum等primitive函數(shù)的利用:避免循環(huán) 25
2.2.2 帶時(shí)間戳的數(shù)據(jù)框合并 26
2.2.3 時(shí)序數(shù)據(jù)可視化:多個(gè)子圖共用一個(gè)x軸 29
2.2.4 時(shí)序數(shù)據(jù)可視化:NA用來(lái)間隔顯示時(shí)序 31
2.2.5 參數(shù)區(qū)間的對(duì)比顯示(在概率密度圖上) 31
2.2.6 獲取R文件的所在路徑 32
2.2.7 分段線性回歸如何通過(guò)lm()實(shí)現(xiàn) 33
2.3.1 引言 33
2.3.2 R語(yǔ)言EDA包 34
2.3.3 其他工具包 36
2.3.4 小結(jié) 37
2.4.1 數(shù)據(jù)的業(yè)務(wù)化 38
2.4.2 業(yè)務(wù)的數(shù)據(jù)化 41
2.4.3 機(jī)理演繹法 45
2.4.4 細(xì)致求實(shí)的基本素養(yǎng) 48
2.4.5 小結(jié) 50
2.5.1 基于數(shù)據(jù)類型的特征提取 51
2.5.2 基于關(guān)聯(lián)關(guān)系的特征自動(dòng)生成 54
2.5.3 基于語(yǔ)法樹的變量間組合特征生成 55
2.6.1 特征選擇的框架 56
2.6.2 搜索策略 57
2.6.3 子集評(píng)價(jià) 59
2.6.4 小結(jié) 65
3.1 統(tǒng)計(jì)分析 67
3.1.1 概率分布 69
3.1.2 參數(shù)估計(jì) 69
3.1.3 假設(shè)檢驗(yàn) 72
3.2.2 基于核函數(shù)的非參數(shù)方法 73
3.2.3 單概率分布的參數(shù)化擬合 76
3.2.4 混合概率分布估計(jì) 79
3.2.5 小結(jié) 81
3.3.1 引言 82
3.3.2 基礎(chǔ)線性回歸模型———OLS模型 82
3.3.3 OLS模型檢驗(yàn) 85
3.3.4 魯棒線性回歸 91
3.3.5 結(jié)構(gòu)復(fù)雜度懲罰(正則化) 94
3.3.6 擴(kuò)展 94
3.4.1 引言 96
3.4.2 前向計(jì)算過(guò)程 98
3.4.3 后剪枝過(guò)程 99
3.4.4 變量重要性評(píng)價(jià) 99
3.4.5 MARS與其他算法的關(guān)系 100
3.5.1 ANN逼近能力的直觀理解 101
3.5.2 極限學(xué)習(xí)機(jī) 106
3.6.1 決策樹的概念 111
3.6.2 決策樹構(gòu)建過(guò)程 112
3.6.3 常用決策樹算法 113
3.7.1 引言 117
3.7.2 epsilon-SVR算法 118
3.7.3 nu-SVR算法 122
3.7.4 不同SVM算法包的差異 123
3.7.5 擴(kuò)展 124
3.8.1 引言 124
3.8.2 工作原理 125
3.8.3 示例 126
3.8.4 討論 128
3.9.1 引言 129
3.9.2 樸素貝葉斯 130
3.9.3 貝葉斯網(wǎng)絡(luò) 131
3.9.4 一般圖模型 134
3.9.5 討論與擴(kuò)展閱讀 140
3.10.1 引言 141
3.10.2 Bagging方法 142
3.10.3 Boosting方法 143
3.10.4 Stacking方法 149
3.11.1 引言 157
3.11.2 評(píng)價(jià)指標(biāo) 157
3.11.3 評(píng)價(jià)方法 163
3.11.4 特征重要度 165
3.12.1 引言 167
3.12.2 基于距離的聚類:K-means、PAM 167
3.12.3 基于層次的聚類:Hclust 169
3.12.4 基于密度的聚類:DBSCAN 171
3.12.5 基于分布的聚類:GMM 173
3.12.6 聚類結(jié)果的評(píng)價(jià) 173
3.13.1 引言 176
3.13.2 關(guān)聯(lián)規(guī)則概念與度量指標(biāo) 176
3.13.3 關(guān)聯(lián)規(guī)則實(shí)現(xiàn)過(guò)程 176
3.13.4 關(guān)聯(lián)規(guī)則算法 177
3.13.5 關(guān)聯(lián)規(guī)則可視化 180
3.13.6 關(guān)聯(lián)規(guī)則評(píng)價(jià) 182
3.14.1 引言 183
3.14.2 深度學(xué)習(xí)算法分類 183
3.14.3 深度學(xué)習(xí)框架 189
3.14.4 常見疑惑 194
3.14.5 深度學(xué)習(xí)算法的加速 196
3.15.1 計(jì)算負(fù)載模式 196
3.15.2 并行化計(jì)算 199
3.15.3 新計(jì)算范式 200
4.1 時(shí)序算法簡(jiǎn)介 210
4.2.1 傅里葉變換的直觀理解 212
4.2.2 時(shí)頻分析 216
4.2.3 時(shí)序變換 223
4.2.4 壓縮感知 230
4.3.1 STL 234
4.3.2 奇異譜分析 238
4.3.3 EMD及擴(kuò)展方法 245
4.4.1 Changepoint 250
4.4.2 TreeSplit 253
4.4.3 Autoplait 254
4.4.4 應(yīng)用示例 255
4.6.1 數(shù)值型頻繁模式 264
4.6.2 符號(hào)型頻繁模式 266
4.7.1 基于度量的方法 270
4.7.2 基于模型重構(gòu)的方法 271
4.7.3 基于頻繁模式挖掘的方法 271
4.8.1 DTW距離 277
4.8.2 SAX距離 277
4.9.1 經(jīng)典分析算法 281
4.9.2 深度學(xué)習(xí)的方法 282
4.10.1 基于時(shí)序分解的預(yù)測(cè)算法 288
4.10.2 基于回歸建模的預(yù)測(cè)算法 289
5.1 優(yōu)化算法 293
5.1.1 模型分類 293
5.1.2 經(jīng)典組合優(yōu)化模型 297
5.1.3 典型工具 300
5.3.1 算法分類 303
5.3.2 典型工具 305
5.4.1 文本數(shù)據(jù) 306
5.4.2 圖像數(shù)據(jù) 311
5.4.3 時(shí)空數(shù)據(jù) 318
6.1 工業(yè)分析中的數(shù)據(jù)預(yù)處理 322
6.1.1 工況劃分 322
6.1.2 數(shù)據(jù)缺失 323
6.1.3 時(shí)間數(shù)據(jù)不連續(xù) 324
6.1.4 強(qiáng)噪聲 324
6.1.5 大慣性系統(tǒng) 324
6.1.6 趨勢(shì)項(xiàng)的消除 324
6.3.1 毛刺檢測(cè)特征 330
6.3.2 單調(diào)趨勢(shì)模式 331
6.3.3 平穩(wěn)過(guò)程的漂移檢測(cè) 331
6.3.4 多點(diǎn)位不一致 332
6.3.5 超界 333
6.3.6 變點(diǎn)檢測(cè) 333
6.3.7 一維曲線平滑與分區(qū) 335
6.3.9 持續(xù)某種狀態(tài) 336
6.4.1 工業(yè)時(shí)序數(shù)據(jù)的特點(diǎn) 338
6.4.2 短時(shí)序分類問(wèn)題 339
6.4.3 長(zhǎng)時(shí)序分類問(wèn)題 341
6.4.4 不同類型問(wèn)題的轉(zhuǎn)換 342
7.1 概述 345
7.2.1 物料跟蹤模型 347
7.2.2 過(guò)程穩(wěn)定性監(jiān)控 348
7.4.1 應(yīng)用示例 352
7.4.2 工況劃分 354
7.4.3 操作參數(shù)優(yōu)化 355
7.4.4 其他分析 356
7.5.1 應(yīng)用示例 356
7.5.2 理想工藝過(guò)程擬合 360
7.5.3 動(dòng)態(tài)控制優(yōu)化 361
7.6.1 應(yīng)用示例 363
7.6.2 佳工藝路徑挖掘 364
7.6.3 異常排查 364
7.6.4 操作參數(shù)優(yōu)化 365
8.1 決策優(yōu)化問(wèn)題的建模思路 370
8.2.1 絕對(duì)值 372
8.2.2 Min-Max問(wèn)題 373
8.2.4 范圍約束 374
8.3.1 決策變量值域不連續(xù) 374
8.3.2 目標(biāo)函數(shù)不連續(xù) 375
8.3.3 或關(guān)系約束 376
8.3.4 條件型約束 376
8.3.5 邏輯表達(dá)式 376
8.3.6 消除變量相乘 377
8.3.7 大M法 377
8.4.1 業(yè)務(wù)問(wèn)題描述 378
8.4.2 問(wèn)題一:路線優(yōu)化 379
8.4.3 問(wèn)題二:排班計(jì)劃 380
8.4.4 思考與小結(jié) 384
8.5.1 預(yù)測(cè)量的要素分解方法 386
8.5.2 例外場(chǎng)景的處理 387
8.5.3 宏觀環(huán)境變化的處理方法 388
9.1 討論范疇 390
9.1.1 知識(shí)類型 390
9.1.2 技術(shù)方法 391
9.1.3 業(yè)務(wù)領(lǐng)域 392
9.1.4 方法論的作用 392
9.1.5 現(xiàn)有的知識(shí)沉淀方法論 392
9.3.1 共性要素 394
9.3.2 傳感器異常報(bào)警 394
9.3.3 異常預(yù)警:“特征量-征兆量-研判規(guī)則”的范式 397
9.3.4 健康評(píng)估:“劣化度-健康度-綜合評(píng)價(jià)”的范式 400
9.3.5 故障類型研判:“特征量-證據(jù)/現(xiàn)象-推理邏輯”的范式 401
9.3.6 故障處置效果監(jiān)控:“癥狀-異常類型/嚴(yán)重等級(jí)-處置措施-狀態(tài)”的范式 401
9.3.8 性能優(yōu)化:無(wú)固定范式 403
9.5.1 專家規(guī)則驅(qū)動(dòng)的方法:AI-FIT-PM過(guò)程模型 406
9.5.2 少量樣本驅(qū)動(dòng)的方法 419
9.5.3 數(shù)據(jù)驅(qū)動(dòng)的方法 423
9.5.4 不同方法間的轉(zhuǎn)化 423
9.6.1 領(lǐng)域建模 424
9.6.2 模型研發(fā)環(huán)境 424
9.6.3 模型部署運(yùn)行環(huán)境 425
9.9.1 案例背景 431
9.9.2 系統(tǒng)動(dòng)力學(xué)模型 434
9.9.3 異常預(yù)警規(guī)則模型 435
9.9.4 故障排查邏輯 436
10.1 數(shù)據(jù)分析項(xiàng)目失敗的原因 440
10.3.1 應(yīng)用范式 444
10.3.2 模型格式 446
10.4.1 MLOps的內(nèi)容 447
10.4.2 MLOps與其他Ops的關(guān)系 449
10.4.3 MLOps的支撐軟件 450
10.4.4 工業(yè)數(shù)據(jù)分析MLOps的特點(diǎn) 451
10.4.5 MLOps的適用范圍 452
10.5.1 分析服務(wù)引擎 452
10.5.2 Web應(yīng)用引擎 453
10.6.1 交互式報(bào)告工具 457
10.6.2 基于Markdown的報(bào)告工具 458
10.6.3 基于Office API的報(bào)告工具 459
10.7.1 任務(wù)管理 460
10.7.2 計(jì)算并行化 460
參考文獻(xiàn)
展開全部
工業(yè)大數(shù)據(jù)分析算法實(shí)戰(zhàn)/大數(shù)據(jù)與智能+產(chǎn)教融合叢書 作者簡(jiǎn)介
田春華,博士,北京工業(yè)大數(shù)據(jù)創(chuàng)新中心首席數(shù)據(jù)科學(xué)家,清華大學(xué)工業(yè)大數(shù)據(jù)研究中心,首席數(shù)據(jù)科學(xué)家;曾任IBM中國(guó)研究院研究經(jīng)理,IEEE、INFORMS、ACM等學(xué)術(shù)組織及 學(xué)術(shù)會(huì)議分會(huì) 、執(zhí)行委員、 學(xué)術(shù)期刊審稿人。長(zhǎng)期負(fù)責(zé)數(shù)據(jù)挖掘算法研究和產(chǎn)品工作,在 裝備制造、石油石化、新能源、航空與港口等行業(yè),幫助幾十家 外 企業(yè)成功實(shí)施資產(chǎn)管理、運(yùn)營(yíng)優(yōu)化、營(yíng)銷洞察等數(shù)據(jù)分析項(xiàng)目。參與了多個(gè)工業(yè)大數(shù)據(jù)相關(guān)標(biāo)準(zhǔn)的制定工作、白皮書的編寫工作、競(jìng)賽支持工作。發(fā)表論文近百篇,擁有40余項(xiàng) 發(fā)明專利授權(quán)。