包郵 數(shù)據(jù)清洗(普通高等教育數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)教材)
-
>
全國(guó)計(jì)算機(jī)等級(jí)考試最新真考題庫(kù)模擬考場(chǎng)及詳解·二級(jí)MSOffice高級(jí)應(yīng)用
-
>
決戰(zhàn)行測(cè)5000題(言語理解與表達(dá))
-
>
軟件性能測(cè)試.分析與調(diào)優(yōu)實(shí)踐之路
-
>
第一行代碼Android
-
>
JAVA持續(xù)交付
-
>
EXCEL最強(qiáng)教科書(完全版)(全彩印刷)
-
>
深度學(xué)習(xí)
數(shù)據(jù)清洗(普通高等教育數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)教材) 版權(quán)信息
- ISBN:9787522603827
- 條形碼:9787522603827 ; 978-7-5226-0382-7
- 裝幀:一般膠版紙
- 冊(cè)數(shù):暫無
- 重量:暫無
- 所屬分類:>
數(shù)據(jù)清洗(普通高等教育數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)教材) 內(nèi)容簡(jiǎn)介
本書編寫目的是向讀者介紹大數(shù)據(jù)清洗的基本概念和相應(yīng)的技術(shù)應(yīng)用,共分 8 章:數(shù)據(jù)清洗簡(jiǎn)介、數(shù)據(jù)清洗中的理論基礎(chǔ)、文件格式及其轉(zhuǎn)換、 數(shù)據(jù)清洗中的理論基礎(chǔ)、文件格式及其轉(zhuǎn)換、Excel 數(shù)據(jù)清洗、Kettle 數(shù)據(jù)清洗、Kettle 與數(shù)據(jù)倉(cāng)庫(kù)、Python 數(shù)據(jù)清洗、數(shù)據(jù)清洗綜合實(shí)訓(xùn)。本書將理論與實(shí)踐操作相結(jié)合,通過大量的案例幫助讀者快速了解和應(yīng)用數(shù)據(jù)清洗相關(guān)技術(shù),并對(duì)重要的核心知識(shí)點(diǎn)加大練習(xí)比例,以達(dá)到熟練應(yīng)用的目的。本書適用于高校人工智能、大數(shù)據(jù)技術(shù)相關(guān)專業(yè)的學(xué)生,也可供大數(shù)據(jù)技術(shù)愛好者自學(xué)使用。
數(shù)據(jù)清洗(普通高等教育數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)教材) 目錄
第1章 數(shù)據(jù)清洗簡(jiǎn)介
1.1 數(shù)據(jù)清洗概述
1.1.1 什么是數(shù)據(jù)清洗
1.1.2 數(shù)據(jù)清洗的原理
1.1.3 數(shù)據(jù)清洗的過程
1.2 數(shù)據(jù)質(zhì)量管理
1.2.1 數(shù)據(jù)質(zhì)量管理的含義
1.2.2 數(shù)據(jù)質(zhì)量的評(píng)估
1.2.3 數(shù)據(jù)質(zhì)量管理應(yīng)用
1.3 數(shù)據(jù)清洗模型研究
1.3.1 數(shù)據(jù)清洗模型描述
1.3.2 數(shù)據(jù)清洗模型應(yīng)用
1.4 數(shù)據(jù)清洗常用軟件與工具
1.4.1 數(shù)據(jù)清洗常用軟件
1.4.2 數(shù)據(jù)清洗常用工具
1.5 實(shí)訓(xùn)
練習(xí)1
第2章 數(shù)據(jù)清洗中的理論基礎(chǔ)
2.1 微積分
2.1.1 微積分概述
2.1.2 微積分的作用
2.2 線性代數(shù)
2.2.1 線性代數(shù)概述
2.2.2 線性代數(shù)的定義
2.3 概率論與數(shù)理統(tǒng)計(jì)
2.3.1 概率論與數(shù)理統(tǒng)計(jì)概述
2.3.2 概率論與數(shù)理統(tǒng)計(jì)基本概念
2.4 *優(yōu)化理論
2.4.1 *優(yōu)化理論定義
2.4.2 凸函數(shù)
2.5 主成分分析
2.5.1 主成分分析概述
2.5.2 主成分分析的實(shí)現(xiàn)
2.6 數(shù)據(jù)清洗常見算法
2.6.1 哈希算法
2.6.2 字符串匹配算法
2.6.3 聚類算法
2.7 實(shí)訓(xùn)
練習(xí)2
第3章 文件格式及其轉(zhuǎn)換
3.1 文件格式概述
3.1.1 文件格式簡(jiǎn)介
3.1.2 Windows中常見的文件格式介紹
3.2 數(shù)據(jù)類型與字符編碼
3.2.1 數(shù)據(jù)類型
3.2.2 字符編碼
3.3 跨平臺(tái)數(shù)據(jù)傳輸格式
3.3.1 XML
3.3.2 ISON
3.4 Kettle中文件格式的運(yùn)行與轉(zhuǎn)換
3.4.1 文本文件的轉(zhuǎn)換
3.4.2 XML文件的轉(zhuǎn)換
3.4.3 JSON文件的轉(zhuǎn)換
3.4.4 CSV文件的轉(zhuǎn)換
3.5 實(shí)訓(xùn)
練習(xí)3
第4章 Excel數(shù)據(jù)清洗
4.1 認(rèn)識(shí)Excel
4.1.1 Excel介紹
4.1.2 Excel數(shù)據(jù)清洗的特點(diǎn)
4.2 Excel數(shù)據(jù)清洗基本操作
4.2.1 Excel數(shù)據(jù)工具的認(rèn)識(shí)
4.2.2 Excel數(shù)據(jù)工具的應(yīng)用
4.3 使用Excel中的函數(shù)進(jìn)行數(shù)據(jù)清洗
4.3.1 Excel中的函數(shù)介紹
4.3.2 Excel函數(shù)的具體應(yīng)用
4.4 .實(shí)訓(xùn)
練習(xí)4
第5章 Kettle數(shù)據(jù)清洗
5.1 Kettle數(shù)據(jù)清洗概述
5.1.1 Kettle數(shù)據(jù)清洗簡(jiǎn)介
5.11 2 Kettle數(shù)據(jù)清洗的認(rèn)識(shí)
5.2 Kettle數(shù)據(jù)清洗基礎(chǔ)
5.2.1 Kettle數(shù)據(jù)清洗基本操作
5.2.2 Kettle數(shù)據(jù)清洗的實(shí)現(xiàn)
5.3 實(shí)訓(xùn)
練習(xí)5
第6章 Kettle與數(shù)據(jù)倉(cāng)庫(kù)
6.1 數(shù)據(jù)倉(cāng)庫(kù)概述
6.1.1 什么是數(shù)據(jù)倉(cāng)庫(kù)
6.1.2 數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn)
6.2 Kettle中的數(shù)據(jù)倉(cāng)庫(kù)相關(guān)技術(shù)
6.2.1 Kettle連接數(shù)據(jù)庫(kù)
6.2.2 Kettle成功連接數(shù)據(jù)庫(kù)的其他操作
6.3 Kettle在數(shù)據(jù)倉(cāng)庫(kù)中的應(yīng)用
6.3.1 Kettle讀取數(shù)據(jù)庫(kù)
6.3.2 Kettle遷移數(shù)據(jù)庫(kù)
6.4 實(shí)訓(xùn)
練習(xí)6
第7章 Pyttlon數(shù)據(jù)清洗
7.1 Python數(shù)據(jù)清洗概述
7.1.1 Python數(shù)據(jù)清洗簡(jiǎn)介
7.1.2 Python擴(kuò)展庫(kù)的安裝與導(dǎo)入
7.2 Python數(shù)據(jù)清洗基礎(chǔ)
7.2.1 NumPy庫(kù)的使用
7.2.2 Pandas庫(kù)的使用
7.3 機(jī)器學(xué)習(xí)中的數(shù)據(jù)清洗
7.3.1 Seabom庫(kù)
7.3.2 對(duì)機(jī)器學(xué)習(xí)中的數(shù)據(jù)集進(jìn)行分析清洗
7.4 Python中的時(shí)間序列
7.4.1 時(shí)間序列基礎(chǔ)datetime
7.4.2 Pandas中的日期與時(shí)間工具
7.5 實(shí)訓(xùn)
練習(xí)7
第8章 數(shù)據(jù)清洗綜合實(shí)訓(xùn)
8.1 Kettle輸入記錄排序
8.2 Kettle數(shù)據(jù)流優(yōu)先級(jí)排序
8.3 Kettle生成記錄排序
8.4 使用Python清洗數(shù)據(jù)
8.5 Python讀取CSV文檔
參考文獻(xiàn)
- >
上帝之肋:男人的真實(shí)旅程
- >
詩(shī)經(jīng)-先民的歌唱
- >
我與地壇
- >
人文閱讀與收藏·良友文學(xué)叢書:一天的工作
- >
伯納黛特,你要去哪(2021新版)
- >
姑媽的寶刀
- >
莉莉和章魚
- >
回憶愛瑪儂