中圖網(wǎng)

>

研究生/本科/專科教材

PYTHON爬蟲大數(shù)據(jù)采集與挖掘(第2版·微課視頻版)

包郵 PYTHON爬蟲大數(shù)據(jù)采集與挖掘(第2版·微課視頻版)

作者：曾劍平著

出版社：清華大學(xué)出版社出版時間：2025-01-01

開本：其他頁數(shù)： 0

本類榜單：教材銷量榜

中圖價:¥50.6(8.5折) 定價 ~~¥59.8~~ 登錄后可看到會員價

加入購物車收藏

開年大促， 全場包郵

?新疆、西藏除外

本類五星書更多>

>
闖進數(shù)學(xué)世界――探秘歷史名題

闖進數(shù)學(xué)世界――探秘歷史名題

¥20.7¥32.8
>
中醫(yī)基礎(chǔ)理論

中醫(yī)基礎(chǔ)理論

¥51.7¥59
>
當代中國政府與政治(新編21世紀公共管理系列教材)

當代中國政府與政治(新編21世紀公共管理系列教材)

¥31.2¥48
>
高校軍事課教程

高校軍事課教程

¥12.4¥38
>
思想道德與法治(2021年版)

思想道德與法治(2021年版)

¥8.5¥18
>
毛澤東思想和中國特色社會主義理論體系概論(2021年版)

毛澤東思想和中國特色社會主義理論體系概論(2021年版)

¥8.5¥25
>
中醫(yī)內(nèi)科學(xué)·全國中醫(yī)藥行業(yè)高等教育“十四五”規(guī)劃教材

中醫(yī)內(nèi)科學(xué)·全國中醫(yī)藥行業(yè)高等教育“十四五”規(guī)劃教材

¥85.1¥99

商品詳情
商品評論(0條)

中圖價:¥50.6 加入購物車

版權(quán)信息
本書特色
內(nèi)容簡介
前言
目錄

PYTHON爬蟲大數(shù)據(jù)采集與挖掘(第2版·微課視頻版) 版權(quán)信息

ISBN：9787302678250
條形碼：9787302678250 ; 978-7-302-67825-0
裝幀：平裝-膠訂
冊數(shù)：暫無
重量：暫無
所屬分類：
教材
>
研究生/本科/專科教材

PYTHON爬蟲大數(shù)據(jù)采集與挖掘(第2版·微課視頻版) 本書特色

本書圍繞大數(shù)據(jù)采集與挖掘，對采集技術(shù)的相關(guān)基礎(chǔ)、技術(shù)原理、Python實現(xiàn)技術(shù)、大數(shù)據(jù)挖掘與應(yīng)用方法進行了系統(tǒng)介紹。本書配套資源豐富，包括教學(xué)大綱、教學(xué)課件、電子教案、程序源碼、習(xí)題答案、微課視頻和在線題庫。

PYTHON爬蟲大數(shù)據(jù)采集與挖掘(第2版·微課視頻版) 內(nèi)容簡介

"本書圍繞大數(shù)據(jù)采集與挖掘，對采集技術(shù)的相關(guān)基礎(chǔ)、技術(shù)原理、Python實現(xiàn)技術(shù)、大數(shù)據(jù)挖掘與應(yīng)用方法進行了系統(tǒng)介紹。書中全面、完整地覆蓋了各種類型的網(wǎng)絡(luò)爬蟲及相關(guān)的信息處理挖掘技術(shù)，并提供了45個與爬蟲技術(shù)和應(yīng)用相關(guān)的Python程序。全書共分為四部分，即概述、基礎(chǔ)篇、技術(shù)與實現(xiàn)篇、大數(shù)據(jù)挖掘與應(yīng)用篇。**部分（第1章）是概述，指出利用Python采集互聯(lián)網(wǎng)大數(shù)據(jù)的重要性，介紹了相關(guān)技術(shù)研究、技術(shù)體系、采集技術(shù)的合規(guī)性及應(yīng)用現(xiàn)狀等，分析了大模型對互聯(lián)網(wǎng)大數(shù)據(jù)技術(shù)的影響；第二部分（第2、3章）是基礎(chǔ)篇，包括Web服務(wù)器的應(yīng)用架構(gòu)以及HTTP、Robots、HTML、頁面編碼等相關(guān)協(xié)議和規(guī)范；第三部分（第4~10章）是技術(shù)與實現(xiàn)篇，全面介紹普通網(wǎng)絡(luò)爬蟲技術(shù)、動態(tài)頁面采集方法、主題爬蟲技術(shù)、Deep Web爬蟲、微博信息采集、Web信息提取以及反爬蟲技術(shù)等，內(nèi)容涵蓋各種爬蟲技術(shù)實現(xiàn)方法及Python實例；第四部分（第11、12章）是大數(shù)據(jù)挖掘與應(yīng)用篇，介紹文本、情感、社交網(wǎng)絡(luò)和時間序列等典型大數(shù)據(jù)處理與挖掘技術(shù) 及應(yīng)用模式，并以新聞輿情監(jiān)測、 Web自動化測試、酒店評論文本挖掘為例介紹Python爬蟲應(yīng)用構(gòu)建方法，將本書介紹的一些關(guān)鍵技術(shù)、模型和工具貫穿在一起。 "

PYTHON爬蟲大數(shù)據(jù)采集與挖掘(第2版·微課視頻版)PYTHON爬蟲大數(shù)據(jù)采集與挖掘(第2版·微課視頻版) 前言

黨的二十大報告強調(diào)： “加快發(fā)展數(shù)字經(jīng)濟，促進數(shù)字經(jīng)濟和實體經(jīng)濟深度融合”，互聯(lián)網(wǎng)大數(shù)據(jù)在數(shù)字經(jīng)濟中占據(jù)著核心地位，是推動經(jīng)濟社會發(fā)展的關(guān)鍵生產(chǎn)要素。互聯(lián)網(wǎng)數(shù)據(jù)具有典型的大數(shù)據(jù)特征，即數(shù)據(jù)量大、數(shù)據(jù)類型多樣化、數(shù)據(jù)流動性快，并且隨著“互聯(lián)網(wǎng) ”和數(shù)字經(jīng)濟國家戰(zhàn)略的推進，互聯(lián)網(wǎng)大數(shù)據(jù)的應(yīng)用價值變得多樣化。因此，互聯(lián)網(wǎng)大數(shù)據(jù)成為大數(shù)據(jù)技術(shù)教學(xué)和研究應(yīng)用的重要數(shù)據(jù)源。
第二部分為基礎(chǔ)篇，包括第2章和第3章。
第2章介紹Web頁面及相關(guān)處理技術(shù)，包括HTML規(guī)范、編碼體系與規(guī)范、正則表達式以及與爬蟲程序設(shè)計相關(guān)的主要Python程序基礎(chǔ)。
第12章介紹三種典型的大數(shù)據(jù)采集技術(shù)應(yīng)用案例，包括新聞輿情監(jiān)測、Web網(wǎng)站自動化測試和酒店評論文本挖掘。
為便于教學(xué)，本書提供豐富的配套資源，包括教學(xué)大綱、教學(xué)課件、電子教案、程序源碼、習(xí)題答案和微課視頻。
資源下載提示
全書由曾劍平負責(zé)內(nèi)容安排、統(tǒng)稿，由互聯(lián)網(wǎng)大數(shù)據(jù)處理技術(shù)和應(yīng)用研究領(lǐng)域的一線人員參與編寫。段江嬌參與編寫了黨的二十大報告強調(diào)： “加快發(fā)展數(shù)字經(jīng)濟，促進數(shù)字經(jīng)濟和實體經(jīng)濟深度融合”，互聯(lián)網(wǎng)大數(shù)據(jù)在數(shù)字經(jīng)濟中占據(jù)著核心地位，是推動經(jīng)濟社會發(fā)展的關(guān)鍵生產(chǎn)要素。互聯(lián)網(wǎng)數(shù)據(jù)具有典型的大數(shù)據(jù)特征，即數(shù)據(jù)量大、數(shù)據(jù)類型多樣化、數(shù)據(jù)流動性快，并且隨著“互聯(lián)網(wǎng) ”和數(shù)字經(jīng)濟國家戰(zhàn)略的推進，互聯(lián)網(wǎng)大數(shù)據(jù)的應(yīng)用價值變得多樣化。因此，互聯(lián)網(wǎng)大數(shù)據(jù)成為大數(shù)據(jù)技術(shù)教學(xué)和研究應(yīng)用的重要數(shù)據(jù)源。 編者于2020年出版的《Python爬蟲大數(shù)據(jù)采集與挖掘微課視頻版》，以互聯(lián)網(wǎng)大數(shù)據(jù)的采集與挖掘為主題，介紹相關(guān)技術(shù)基礎(chǔ)、大數(shù)據(jù)采集技術(shù)、大數(shù)據(jù)挖掘及應(yīng)用技術(shù)。本書(第2版)進一步豐富了多種互聯(lián)網(wǎng)大數(shù)據(jù)的處理，完善了爬蟲技術(shù)體系，提升了知識的完整性、邏輯性和實用性。 在內(nèi)容安排上，本書涵蓋Web應(yīng)用架構(gòu)技術(shù)、Web頁面及相關(guān)技術(shù)、各種爬蟲采集技術(shù)、Web信息提取技術(shù)、大數(shù)據(jù)處理與挖掘以及應(yīng)用技術(shù)。在爬蟲技術(shù)上，本書涵蓋各種不同類型的爬蟲，包括普通爬蟲、動態(tài)爬蟲、主題爬蟲、Deep Web爬蟲以及微博爬蟲。在大數(shù)據(jù)處理方面，本書涵蓋文本、社交網(wǎng)絡(luò)、時間序列等不同類型數(shù)據(jù)處理。在應(yīng)用方面，本書以三種典型的Web信息采集與處理為例，介紹了爬蟲技術(shù)的應(yīng)用模式與Python實現(xiàn)方法。 本書作為一本產(chǎn)學(xué)兼顧的教材，具有如下特色。 (1) 以互聯(lián)網(wǎng)大數(shù)據(jù)技術(shù)為主線，將Web應(yīng)用技術(shù)、各種頁面采集的共性技術(shù)與特有技術(shù)、大數(shù)據(jù)處理與挖掘以及爬蟲合規(guī)性等相關(guān)技術(shù)有機地結(jié)合在一起，涉及當前互聯(lián)網(wǎng)Web空間的典型應(yīng)用，構(gòu)成完整的大數(shù)據(jù)采集和挖掘的知識體系。 (2) 在互聯(lián)網(wǎng)大數(shù)據(jù)的采集技術(shù)中，完整系統(tǒng)地涵蓋了普通爬蟲、動態(tài)爬蟲、主題爬蟲、Deep Web爬蟲以及微博數(shù)據(jù)采集，既強調(diào)爬蟲抓取數(shù)據(jù)的能力，也凸顯爬蟲采集互聯(lián)網(wǎng)大數(shù)據(jù)的合規(guī)性技術(shù)，有利于讀者全面理解網(wǎng)絡(luò)爬蟲大數(shù)據(jù)技術(shù)及其應(yīng)用。 (3) 秉承“授人以魚，不如授人以漁”的總體思路，本書將理論與實踐相結(jié)合，書中既有相關(guān)技術(shù)原理的介紹，也包含大量的Python實現(xiàn)技術(shù)、開源架構(gòu)等方面的介紹，提供了45個與大數(shù)據(jù)采集挖掘相關(guān)的Python程序，讀者既能理解技術(shù)原理，又能動手實踐。 本書分為四部分，共12章，涵蓋互聯(lián)網(wǎng)大數(shù)據(jù)采集與挖掘的基礎(chǔ)、技術(shù)和應(yīng)用，各章的內(nèi)容安排如下。 **部分為概述，包括第1章。 第1章對大數(shù)據(jù)采集與挖掘的重要性、技術(shù)體系、應(yīng)用現(xiàn)狀、合規(guī)性以及技術(shù)發(fā)展進行概述，強調(diào)了互聯(lián)網(wǎng)大數(shù)據(jù)與大模型之間的緊密聯(lián)系。 第二部分為基礎(chǔ)篇，包括第2章和第3章。 第2章介紹Web頁面及相關(guān)處理技術(shù)，包括HTML規(guī)范、編碼體系與規(guī)范、正則表達式以及與爬蟲程序設(shè)計相關(guān)的主要Python程序基礎(chǔ)。 第3章對Web應(yīng)用架構(gòu)與協(xié)議進行介紹，包括常用的Web服務(wù)器軟件、Web應(yīng)用架構(gòu)、Robots協(xié)議、HTTP協(xié)議、狀態(tài)保持技術(shù)等與爬蟲密切相關(guān)的技術(shù)。 第三部分為技術(shù)與實現(xiàn)篇，包括第4~10章。 第4章對普通爬蟲頁面采集技術(shù)與Python實現(xiàn)進行介紹，包括普通爬蟲的體系架構(gòu)、Web服務(wù)器連接器、超鏈接及域名提取與過濾、爬行策略與實現(xiàn)以及爬蟲的多線程技術(shù)等。 第5章介紹動態(tài)頁面采集技術(shù)與Python實現(xiàn)，包括動態(tài)頁面內(nèi)容的生成與交互、動態(tài)頁面采集的若干種典型方法和Python實現(xiàn)技術(shù)。 第6章針對Web頁面信息提取技術(shù)，介紹面向HTML和JSON類型文本的抽取技術(shù)原理、典型開源框架應(yīng)用，同時給出三種Web數(shù)據(jù)存儲方法。 第7章介紹主題爬蟲頁面采集技術(shù)與Python實現(xiàn)，涉及主題爬蟲的使用場景與技術(shù)框架、主題表示和建模、主題相關(guān)度計算等。 第8章是關(guān)于Deep Web的數(shù)據(jù)采集技術(shù)及實現(xiàn)。 第9章是關(guān)于微博信息的采集方法及實現(xiàn)，主要包括通過API獲取微博信息和通過爬蟲技術(shù)獲取微博信息兩種方法。 第10章介紹反爬蟲的常用技術(shù)，以及針對這些反爬蟲技術(shù)的一些主要應(yīng)對措施和爬蟲對抗技術(shù)。 第四部分為大數(shù)據(jù)挖掘與應(yīng)用篇，包括第11章和第12章。 第11章圍繞互聯(lián)網(wǎng)大數(shù)據(jù)處理與挖掘技術(shù)，介紹面向文本、社交網(wǎng)絡(luò)、時間序列數(shù)據(jù)的處理方法，突出文本預(yù)處理、文本表示、文本情感分析、文本分類、聚類、主題建模等重點技術(shù)。 第12章介紹三種典型的大數(shù)據(jù)采集技術(shù)應(yīng)用案例，包括新聞輿情監(jiān)測、Web網(wǎng)站自動化測試和酒店評論文本挖掘。 為便于教學(xué)，本書提供豐富的配套資源，包括教學(xué)大綱、教學(xué)課件、電子教案、程序源碼、習(xí)題答案和微課視頻。 資源下載提示 課件等資源：掃描封底的“圖書資源”二維碼，在公眾號“書圈”下載。 素材(源碼)等資源：掃描目錄上方的二維碼下載。 微課視頻：掃描封底的文泉云盤防盜碼，再掃描書中相應(yīng)章節(jié)的視頻講解二維碼，可以在線學(xué)習(xí)。 全書由曾劍平負責(zé)內(nèi)容安排、統(tǒng)稿，由互聯(lián)網(wǎng)大數(shù)據(jù)處理技術(shù)和應(yīng)用研究領(lǐng)域的一線人員參與編寫。段江嬌參與編寫了 第1、第4、第5章，廖含月編寫了第2章的部分內(nèi)容，孟元編寫了第12章部分例子的程序及相關(guān)文字說明，曾睿編寫了第11章部分例子的程序，肖楊實現(xiàn)了Web網(wǎng)站自動化測試方法，其他部分由曾劍平編寫，曾睿對全書進行了校對。清華大學(xué)出版社的編輯們?yōu)楸緯某霭婊ㄙM了很多心思。 本書的編寫也得到了復(fù)旦大學(xué)計算機科學(xué)技術(shù)學(xué)院和復(fù)旦大學(xué)教務(wù)處的大力支持。 本書第1版獲得第二屆復(fù)旦大學(xué)優(yōu)秀教材獎(2024)。 此外，在本書的編寫過程中也采納了讀者對第1版的反饋意見，在此一并表示衷心的感謝。需要特別提到的是，為了便于讀者理解相關(guān)技術(shù)，書中選擇若干互聯(lián)網(wǎng)網(wǎng)站頁面采集作為實例，特別向這些網(wǎng)站表示感謝。 本次改版完善了爬蟲采集與挖掘的技術(shù)體系，但仍難以完美，懇請讀者不吝批評指正，以利于今后繼續(xù)修訂完善。 讀者可關(guān)注微信公眾號IntBigData(“互聯(lián)網(wǎng)大數(shù)據(jù)處理技術(shù)與應(yīng)用”)，訂閱編者在教學(xué)中的相關(guān)經(jīng)驗和做法，并與編者互動。 編者2024年10月

顯示全部信息

PYTHON爬蟲大數(shù)據(jù)采集與挖掘(第2版·微課視頻版) 目錄

源碼下載

額外贈送的資源

**部分概述

第1章大數(shù)據(jù)采集與挖掘概述

1.1互聯(lián)網(wǎng)大數(shù)據(jù)與采集

1.1.1互聯(lián)網(wǎng)大數(shù)據(jù)來源

1.1.2互聯(lián)網(wǎng)大數(shù)據(jù)的特征

1.2Python爬蟲大數(shù)據(jù)采集技術(shù)的重要性

1.3爬蟲技術(shù)研究及應(yīng)用現(xiàn)狀

1.4爬蟲技術(shù)的應(yīng)用場景

1.5爬蟲大數(shù)據(jù)采集與挖掘的技術(shù)體系

1.5.1技術(shù)體系構(gòu)成

1.5.2相關(guān)技術(shù)

1.5.3爬蟲的5個技術(shù)特性

1.5.4技術(shù)評價方法

1.6爬蟲大數(shù)據(jù)采集與挖掘的合規(guī)性

1.7爬蟲大數(shù)據(jù)采集與挖掘技術(shù)展望

1.7.1爬蟲采集技術(shù)展望

1.7.2大模型對互聯(lián)網(wǎng)大數(shù)據(jù)技術(shù)的影響

思考題

第二部分基礎(chǔ)篇

第2章Web頁面及相關(guān)處理技術(shù)

2.1HTML規(guī)范

2.1.1HTML標簽

2.1.2HTML整體結(jié)構(gòu)

2.1.3CSS簡述

2.1.4常用標簽

2.1.5HTML的版本進化

2.2編碼體系與規(guī)范

2.2.1ASCII

2.2.2gb2312/gbk

2.2.3unicode

2.2.4utf8

2.2.5網(wǎng)頁中的編碼和Python處理

2.3Python正則表達式

2.4相關(guān)的Python程序基礎(chǔ)

思考題

第3章Web應(yīng)用架構(gòu)與協(xié)議

3.1常用的Web服務(wù)器軟件

3.1.1流行的Web服務(wù)器軟件

3.1.2在Python中配置Web服務(wù)器

3.2Web服務(wù)器的應(yīng)用架構(gòu)

3.2.1典型應(yīng)用架構(gòu)

3.2.2Web頁面的類型

3.2.3頁面文件的組織方式

3.3Robots協(xié)議

3.3.1Robots協(xié)議的來歷

3.3.2Robots協(xié)議的規(guī)范與實現(xiàn)

3.4HTTP

3.4.1HTTP版本的技術(shù)特性

3.4.2HTTP報文

3.4.3HTTP頭部

3.4.4HTTP狀態(tài)碼

3.4.5HTTPS

3.5狀態(tài)保持技術(shù)

3.5.1Cookie

3.5.2Session

思考題

第三部分技術(shù)與實現(xiàn)篇

第4章普通爬蟲頁面采集技術(shù)與Python實現(xiàn)

4.1普通爬蟲的體系架構(gòu)

4.2Web服務(wù)器連接器

4.2.1整體處理過程

4.2.2DNS緩存

4.2.3requests/response的使用方法

4.2.4錯誤和異常的處理

4.3超鏈接及域名提取與過濾

4.3.1超鏈接的類型

4.3.2提取方法

4.3.3遵守Robots協(xié)議的友好爬蟲

4.4爬行策略與實現(xiàn)

4.4.1爬行策略及設(shè)計方法

4.4.2深度優(yōu)先策略和寬度優(yōu)先策略

4.4.3基于PageRank的重要性排序

4.4.4其他策略

4.4.5爬行策略設(shè)計的綜合考慮

4.5爬蟲的多線程技術(shù)

思考題

第5章動態(tài)頁面采集技術(shù)與Python實現(xiàn)

5.1動態(tài)頁面內(nèi)容的生成與交互

5.1.1頁面內(nèi)容的生成方式

5.1.2動態(tài)頁面交互的實現(xiàn)

5.2動態(tài)頁面采集技術(shù)類型

5.3使用帶參數(shù)的URL

5.4利用Cookie和Session

5.5使用Ajax——以評論型頁面為例

5.5.1獲取URL地址

5.5.2獲取并發(fā)送動態(tài)請求參數(shù)

5.6模擬瀏覽器——以自動登錄郵箱為例

思考題

第6章Web信息提取與Python實現(xiàn)

6.1Web信息提取任務(wù)及要求

6.2Web頁面內(nèi)容提取的思路

6.2.1DOM樹

6.2.2提取方法

6.3基于HTML結(jié)構(gòu)的內(nèi)容提取方法

6.3.1html.parser

6.3.2lxml

6.3.3html5lib

6.3.4BeautifulSoup

6.3.5PyQuery

6.4基于統(tǒng)計的Web內(nèi)容提取方法

6.5基于JSON的Web信息提取

6.6Web信息存儲

思考題

第7章主題爬蟲頁面采集技術(shù)與Python實現(xiàn)

7.1主題爬蟲的使用場景

7.2主題爬蟲技術(shù)框架

7.3主題及其表示

7.4相關(guān)度計算

7.4.1主題相關(guān)度計算

7.4.2鏈接相關(guān)度估算

7.4.3內(nèi)容相關(guān)度計算

7.5實例：特定新聞主題的采集

思考題

第8章Deep Web爬蟲與Python實現(xiàn)

8.1相關(guān)概念

8.2Deep Web的特征和采集要求

8.3Deep Web內(nèi)容獲取技術(shù)架構(gòu)

8.3.1領(lǐng)域本體知識庫

8.3.2尋找表單

8.3.3表單處理

8.3.4結(jié)果處理

8.4圖書信息采集

思考題

第9章微博信息采集與Python實現(xiàn)

9.1微博信息采集方法概述

9.2微博開放平臺授權(quán)與測試

9.3在Python中調(diào)用微博API采集數(shù)據(jù)

9.3.1流程介紹

9.3.2微博API及使用方法

9.3.3采集微博用戶個人信息

9.3.4采集微博博文

9.3.5微博API的限制

9.4通過爬蟲采集微博信息

9.4.1爬蟲采集微博的方法

9.4.2微博熱搜的采集方法與Python實現(xiàn)

思考題

第10章反爬蟲技術(shù)與爬蟲對抗技術(shù)

10.1兩種技術(shù)的概述

10.2反爬蟲技術(shù)

10.2.1爬蟲檢測技術(shù)

10.2.2爬蟲阻斷技術(shù)

10.3爬蟲對抗技術(shù)

思考題

第四部分大數(shù)據(jù)挖掘與應(yīng)用篇

第11章互聯(lián)網(wǎng)大數(shù)據(jù)處理與挖掘技術(shù)

11.1文本預(yù)處理

11.1.1詞匯切分

11.1.2停用詞過濾

11.1.3詞形規(guī)范化

11.1.4Python開源庫jieba的使用

11.2文本的向量空間模型

11.2.1特征選擇

11.2.2模型表示

11.2.3使用Python構(gòu)建向量空間表示

11.3文本的分布式表示

11.3.1相關(guān)方法

11.3.2Doc2Vec

11.4文本分類及實現(xiàn)技術(shù)

11.4.1分類技術(shù)概要

11.4.2分類器技術(shù)

11.4.3新聞分類的Python實現(xiàn)

11.5聚類算法

11.6主題及其實現(xiàn)技術(shù)

11.6.1主題的定義

11.6.2基于向量空間的主題構(gòu)建

11.6.3LDA主題模型

11.6.4LDA主題模型的Python實現(xiàn)

11.7文本情感分析

11.7.1基于機器學(xué)習(xí)的方法

11.7.2基于規(guī)則的方法

11.8社交網(wǎng)絡(luò)分析

11.8.1社交網(wǎng)絡(luò)表示與可視化

11.8.2社區(qū)發(fā)現(xiàn)算法與使用

11.8.3分析工具Pajek

11.9時間序列挖掘

11.9.1時間序列及其挖掘任務(wù)

11.9.2時間序列預(yù)測的思路

11.9.3時間序列預(yù)測的例子

11.10大數(shù)據(jù)可視化技術(shù)

11.10.1大數(shù)據(jù)可視化方法概述

11.10.2Python開源庫的使用

思考題

第12章互聯(lián)網(wǎng)大數(shù)據(jù)采集與挖掘技術(shù)的應(yīng)用

12.1常見應(yīng)用模式

12.2新聞輿情監(jiān)測

12.2.1目標任務(wù)

12.2.2總體思路

12.2.3新聞內(nèi)容采集與提取

12.2.4新聞分析

12.3Web網(wǎng)站自動化測試

12.3.1目標任務(wù)

12.3.2總體思路

12.3.3Python程序設(shè)計

12.4酒店評論文本挖掘

12.4.1目標任務(wù)

12.4.2總體思路

12.4.3Python程序設(shè)計

思考題

附錄A代碼與數(shù)據(jù)

附錄B相關(guān)包索引

附錄C爬蟲框架

參考文獻

展開全部

商品評論(0條)

寫書評賺書幣

暫無評論……

書友推薦

>
大紅狗在馬戲團-大紅狗克里弗-助人
大紅狗在馬戲團-大紅狗克里弗-助人
[美] 諾爾曼·伯德韋爾著，杜可名譯
¥4.5~~¥10.0~~
>
莉莉和章魚
莉莉和章魚
[美]史蒂文·羅利著，祝文亭譯
¥15.3~~¥42.0~~
>
李白與唐代文化
李白與唐代文化
葛景春
¥9.9~~¥29.8~~
>
名家?guī)阕x魯迅:故事新編
名家?guī)阕x魯迅:故事新編
魯迅著，陳漱渝主編
¥13.0~~¥26.0~~
>
龍榆生：詞曲概論/大家小書
龍榆生：詞曲概論/大家小書
龍榆生
¥8.7~~¥24.0~~
>
史學(xué)評論
史學(xué)評論
楊玉圣
¥18.9~~¥42.0~~
>
新文學(xué)天穹兩巨星--魯迅與胡適/紅燭學(xué)術(shù)叢書(紅燭學(xué)術(shù)叢書)
新文學(xué)天穹兩巨星--魯迅與胡適/紅燭學(xué)術(shù)叢書(紅燭學(xué)術(shù)叢書)
易竹賢
¥9.9~~¥23.0~~
>
人文閱讀與收藏·良友文學(xué)叢書:一天的工作
人文閱讀與收藏·良友文學(xué)叢書:一天的工作
魯迅
¥15.7~~¥45.8~~