-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
網絡數據爬取與分析實務 版權信息
- ISBN:9787313200327
- 條形碼:9787313200327 ; 978-7-313-20032-7
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
網絡數據爬取與分析實務 本書特色
本書系“電子商務應用型專業系列教材”叢書。根據市場需求,該叢書重新梳理了電子商務應用型人才所需的能力,以電商運營能力、數據分析能力和移動應用設計開發能力為核心,學生可根據自身興趣愛好和擅長點進行自身能力的培養。 本書以校企合作的方式進行教材的編寫。通過與企業合作,吸收企業的行業經驗和實際案例,既提高了教材內容的實踐性,又幫助企業把隱性知識固化為顯性知識。 該叢書包括:1.《跨境電子商務實務》 2.《跨平臺移動商務網站技術及其應用》 3.《網絡數據爬取與分析實務》 4.《移動商務實用教程》
網絡數據爬取與分析實務 內容簡介
本書以Python基本語法為基礎,首先系統介紹Python爬蟲與數據挖掘庫的用法,進而以真實網絡數據爬取與數據挖掘案例為主線,以實戰任務的形式就爬蟲技術原理與Urllib、beautifulsoup、Scrapy等爬蟲架構進行實例分析。很后深入淺出地介紹數據挖掘分析的關鍵任務:數據探索處理、回歸、分類、聚類、關聯規則、可視化等。
網絡數據爬取與分析實務 目錄
1.1什么是數據科學
1.2數據分析師、數據工程師與數據科學家
第2章Python語法基礎
2.1 Python的程序結構
2.2 Python編碼規范
2.3 Python編程環境的搭建
2.4 Python的數據結構
2.5 Python控制語句
習題
第3章 使用Urllib庫編寫爬蟲
3.1 網絡爬蟲概述
3.2 使用Urllib.request模塊編寫爬蟲
3.3 修改User-Agent屬性模擬瀏覽器訪問
3.4 HTTP協議詳解
3.5 模擬HTTP-GET方法的爬蟲
3.6 模擬HTTP-POST方法的爬蟲
習題
第4章 使用正則表達式提取數據
4.1 正則表達式原理
4.2 正則表達式語法
4.3 re模塊常用的函數
4.4 正則表達式應用實例
習題
第5章 使用BeautifulSoup庫提取數據
5.1 BeautifulSoup包簡介
5.2 BeautifulSoup的信息提取
5.3 BeautifulSoup的遍歷
習題
第6章 爬蟲項目實戰
6.1網易新聞中心爬蟲
6.2 通過Session模擬登錄豆瓣
6.3 鏈家二手房信息爬蟲
6.4爬取拉勾網JSON格式數據
習題
第7章 Pandas數據處理基礎
7.1數據處理概述
7.2 Pandas數據結構
7.3 DataFrame的基本操作
7.4 DataFrame數據的連接
7.4 Pandas數據輸入輸出
習題
第8章 Pandas數據處理常用方法
8.1 分組統計與轉換
8.2 缺失值處理
8.3 時間序列數據處理
8.4 向量轉換
習題
第9章 數據處理實戰
9.1二手房數據處理
9.2 職位數據處理
9.3 職位描述的文本信息處理
習題
第10章 SQLite數據庫操作
10.1 SQLite數據庫簡介
10.2 Python讀寫SQLite
10.3 Pandas讀寫SQLite
習題
第11章 機器學習概述
11.1 認識機器學習
11.2 機器學習的應用范圍
11.3 機器學習的算法
11.4 Scikit-learn機器學習包
習題
第12章 從線性回歸到分類
12.1線性回歸算法
12.2 邏輯回歸分類算法
習題
第13章 分類模型及應用
13.1 K近鄰分類算法
13.2 決策樹分類算法
13.3 隨機森林分類算法
習題
第14章 分類模型的評估
14.1訓練與測試樣本
14.2 性能評價指標
14.3分類閾值的調整
習題
參考文獻
網絡數據爬取與分析實務 作者簡介
李周平 上海財經大學博士,網絡與軟件工程師,現任上海商學院信息與計算機學院教師。長期從事網絡爬蟲、數據挖掘、機器學習、自然語言處理、Python程序開發等方面的教學和培訓工作,具有十余年的Python項目開發經驗,獲得多項軟件專利。
- >
伯納黛特,你要去哪(2021新版)
- >
我與地壇
- >
山海經
- >
煙與鏡
- >
史學評論
- >
隨園食單
- >
回憶愛瑪儂
- >
名家帶你讀魯迅:故事新編