-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
Python網絡爬蟲技術與實戰 版權信息
- ISBN:9787111674115
- 條形碼:9787111674115 ; 978-7-111-67411-5
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
Python網絡爬蟲技術與實戰 本書特色
作者多年從事網絡爬蟲領域的教學及研究工作,有著豐富的實踐經驗。 面向初學者全面介紹Python網絡爬蟲的實戰寶典,涵蓋網絡爬蟲的核心概念、算法和技術實現,內容系統,案例豐富。
Python網絡爬蟲技術與實戰 內容簡介
本書基于Python網絡爬蟲, 緊密結合演示應用案例, 系統性地介紹了幾乎所有網絡爬蟲涉及的核心技術。全書分為基礎理論、核心技術和綜合實戰三部分, 宏觀覆蓋了Python的環境搭建、Python基礎語法、爬蟲原理、爬蟲常用庫模塊、正則表達式、驗證碼識別、抓包Fiddler工具、數據存儲、Scrapy爬蟲框架、多線性爬蟲、動態網頁爬蟲和分布式爬蟲等內容, 實戰應用案例也均給出了典型算法及其完整源碼。
Python網絡爬蟲技術與實戰 目錄
前言
第1章 Python環境搭建及基礎學習
1.1 Python 3.6的安裝與配置
1.1.1 Windows下的安裝
1.1.2 Linux下的安裝
1.1.3 macOS下的安裝
1.2 IDE工具:PyCharm的安裝
1.3 基礎語法
1.3.1 **個Python程序
1.3.2 Python命名規范
1.3.3 行和縮進
1.3.4 注釋和續行
1.3.5 Python輸出
1.4 字符串
1.4.1 字符串運算符
1.4.2 字符串內置函數
1.5 數據結構
1.5.1 列表
1.5.2 元組
1.5.3 集合
1.5.4 字典
1.6 控制語句
1.6.1 條件表達式
1.6.2 選擇結構
1.6.3 循環結構
1.7 函數、模塊和包
1.7.1 函數
1.7.2 模塊
1.7.3 包
1.8 文件的讀寫操作
1.8.1 文件讀寫步驟與打開模式
1.8.2 文件的基本操作
1.8.3 文件寫入操作
1.9 面向對象
1.9.1 類和對象
1.9.2 封裝性
1.9.3 繼承性
1.9.4 多態性
1.10 本章小結
練習題
第2章 爬蟲原理和網絡基礎
2.2 爬蟲的意義
2.3 爬蟲的原理
2.4 爬蟲技術的類型
2.4.1 聚焦爬蟲技術
2.4.2 通用爬蟲技術
2.4.3 增量爬蟲技術
2.4.4 深層網絡爬蟲技術
2.5 爬蟲抓取策略
2.5.1 深度優先遍歷策略
2.5.2 廣度優先遍歷策略
2.5.3 PartialPageRank策略
2.5.4 大站優先策略
2.5.5 反向鏈接數策略
2.5.6 0PIC策略
2.6 反爬蟲和反反爬蟲
2.6.1 反爬蟲
2.6.2 反反爬蟲
2.7 網絡基礎
2.7.1 網絡體系結構
2.7.2 網絡協議
2.7.3 Socket編程
2.8 本章小結
練習題
第3章 Python常用庫
3.1 Python庫的介紹
3.1.1 常用標準庫
3.1.2 安裝使用第三方庫
3.2 urllib庫
3.2.1 urlopen()函數用法
3.2.2 urlretrieve()函數用法
3.2.3 URL編碼和URL解碼
3.2.4 urlparse0和urlsplit()數用法
3.3 request庫
3.3.1 request庫的基本使用
3.3.2 request庫的高級用法
3.4 lxml庫
3.4.1 lxml庫的安裝和使用
3.4.2 XPath介紹
3.4.3 XPath語法
3.4.4 lxml和XPath的結合使用
3.5 BeautifuISoup庫
3.5.1 Beautiful Soup庫的安裝和使用
3.5.2 提取數據
3.5.3 CSS選擇器
3.6 實戰案例
3.6.1 使用Beautiful Soup解析網頁
3.6.2 微信公眾號爬蟲
3.6.3 爬取豆瓣讀書TOP500
3.6.4 使用urllib庫爬取百度貼吧
3.7 本章小結
練習題
……
第4章 正則表達式
第5章 驗證碼
第6章 抓包利器Fiddler
第7章 數據存儲
第8章 Scrapy爬蟲框架
第9章 多線程爬蟲
第10章 動態網頁爬蟲
第11章 分布式爬蟲
第12章 電商站商品信息爬蟲項目
第13章 生活娛樂點評類信息爬蟲項目
第14章 圖片信息類爬蟲項目
練習題答案
Python網絡爬蟲技術與實戰 作者簡介
趙國生,哈爾濱師范大學教授,工學博士,碩士生導師,黑龍江省網絡安全技術領域特殊人才。主要從事可信網絡、入侵容忍、認知計算、物聯網安全等方向的教學與科研工作。擔任中國計算機學會容錯專委會委員、黑龍江省計算機學會網絡專委會委員、中國青年博士論壇網絡專委會委員、國家自然科學基金委項目評審專家、黑龍江省國資采購專家組成員、黑龍江省財政廳及黑龍江省高等法院信息化資訊專家、黑龍江省教育廳行業信息系統安全專題培訓講師、中國計算機學會高級會員、中國計算機學會YOCSEF哈爾濱副主席。榮獲哈爾濱師范大學“先進工作者”“五四青年獎章”“寧齊堃”教學名師等榮譽。主持國家自然科學基金、黑龍江省自然科學基金、黑龍江省科技廳科技攻關等項目10項,發表SCI/EI檢索論文50余篇,發明專利2項、實用新型專利6項,擁有軟件著作權6項,獲省/部級科技進步一等獎2項、三等獎1項,撰寫《Linux操作系統原理與應用》《Matlab數學建模與仿真》《Matlab完全學習手冊》《精通Labivew》等編著6部。目前擔任《電子學報》《通信學報》《系統仿真學報》等期刊審稿專家。
- >
伊索寓言-世界文學名著典藏-全譯本
- >
羅庸西南聯大授課錄
- >
月亮與六便士
- >
朝聞道
- >
李白與唐代文化
- >
隨園食單
- >
苦雨齋序跋文-周作人自編集
- >
姑媽的寶刀