-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
數據采集與預處理 版權信息
- ISBN:9787111738909
- 條形碼:9787111738909 ; 978-7-111-73890-9
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
數據采集與預處理 本書特色
本書遵循職業教育教材編寫規律和職業院校學生學習規律,配套齊全。
數據采集與預處理 內容簡介
考慮到目前大數據產業的發展趨勢,本書綜合了現有的數據采集和預處理技術,按照實際工作中的順序,先介紹了大數據及數據采集的基礎知識,然后介紹了使用爬蟲技術進行數據采集、使用傳感器進行數據采集、使用Kettle進行數據遷移和采集以及使用Python進行數據存儲和處理,并以實訓項目的形式,將技術與理論有機融為一體。本書內容詳實、通俗易懂,貼近實用,同時配以課后習題加強學習效果。 本書適合作為職業院校大數據技術、軟件技術、物聯網應用技術等相關專業的教材,也可作為大數據技術培訓以及自學大數據技術的相關人員的參考用書。 本書配有電子課件等資源,選用本書作為授課教材的教師可登錄機械工業出版社教育服務網(www.cmpedu.com)免費注冊后下載課程資源或者聯系編輯 (010-88379807)咨詢。
數據采集與預處理 目錄
一、大數據概念 3
二、數據采集技術 6
三、數據預處理技術10
習題12
項目1 使用爬蟲技術進行數據采集13
任務1 爬取靜態頁面數據15
任務2 使用Scrapy框架爬取動態數據 24
任務3 使用Nutch爬取數據32
小結50
習題50
項目2 使用傳感器進行數據采集53
任務1 利用傳感器采集農業數據55
任務2 利用傳感器智能生產68
小結75
習題75
項目3 使用Kettle進行數據遷移和采集77
任務1 使用Kettle工具進行數據遷移79
任務2 利用Kettle建立作業,定時執行轉換95
小結98
習題98
項目4 使用Python進行數據存儲101
任務1 利用列表、元組、集合與字典進行數據存儲 103
任務2 利用Numpy數組對象進行數據存儲109
任務3 利用Series與DataFrame進行數據存儲118
任務4 讀寫不同數據源數據126
任務5 合并數據134小結144
習題145
項目5 使用Python進行數據處理147
任務1 數據清洗149
任務2 數據標準化160
任務3 分組與聚合163
任務4 透視表與交叉表172
任務5 啞變量178
小結180
習題180
參考文獻182
- >
莉莉和章魚
- >
推拿
- >
月亮虎
- >
詩經-先民的歌唱
- >
大紅狗在馬戲團-大紅狗克里弗-助人
- >
中國人在烏蘇里邊疆區:歷史與人類學概述
- >
巴金-再思錄
- >
中國歷史的瞬間