中圖網小程序
一鍵登錄
更方便
本類五星書更多>
-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
大數據采集與爬蟲 版權信息
- ISBN:9787576325201
- 條形碼:9787576325201 ; 978-7-5763-2520-1
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
大數據采集與爬蟲 內容簡介
本書收集了大數據采集與爬蟲相關的編程案例,分4個單元進行講解,包括單元一爬蟲與網頁、單元二文本類網站的爬蟲、單元三圖片資源的爬蟲、單元四JupyterNotebook(anaconda3)爬蟲編程基礎,共講解了28個編程案例。本書案例內容包括爬蟲程序的工作原理,從網站爬取收集有需要的代碼、文字、圖片等資源的技能,講解以案例應用的形式呈現,并把技能應用結合案例實現過程,以效果目標引領編程,同時,注重理論知識貫穿于案例中。
大數據采集與爬蟲 目錄
項目一 爬蟲與網頁
任務一 使用requests模塊爬取網頁狀態
任務二 在瀏覽器中查看網頁狀態
任務三 爬取在IIS中發布的網頁內容
任務四 爬取網頁標簽的內容
任務五 爬取網頁多個
標簽的內容
任務五 爬取網頁多個標簽的所有文本
任務六 根據標簽類名爬取網頁標簽內容
任務七 用getall()方法爬取網頁標簽內容
任務八 爬取網頁中所有超鏈接的網址
任務九 爬取網頁中超鏈接目標的標題
任務十 爬取網頁中所有標簽
項目二 文本類網站的爬蟲
任務一 爬取網頁特定區域的內容
任務二 爬取網頁兩個特定區域的內容并分別保存于兩個文件中
任務三 爬取網頁招聘信息
任務四 爬取兩個網頁內容合并保存
任務五 從網頁爬取商品銷售信息并排序保存
任務六 爬取網站的小說文本
展開全部
大數據采集與爬蟲 作者簡介
孔令勇,男,2014.9―2020.10重慶市永川職業教育中心黨委委員、副校長;2020.10―重慶市永川職業教育中心黨委書記、校長。參加了重慶市教委的重點課題《職業教育產教融合研究》;牽頭開展了重慶市科協組織的《中職教師發展現狀與需求研究》。曾在《科學咨詢》《重慶文理學院校報》《永川觀察》上發表了論文;參與《中職計算機應用專業》教材編寫;參與重慶市職業教育有關政策、規劃的起草等。
書友推薦
- >
上帝之肋:男人的真實旅程
- >
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)
- >
小考拉的故事-套裝共3冊
- >
月亮虎
- >
羅庸西南聯大授課錄
- >
月亮與六便士
- >
朝聞道
- >
史學評論
本類暢銷