-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
PythonPYTHON社會媒體挖掘 版權信息
- ISBN:9787115494016
- 條形碼:9787115494016 ; 978-7-115-49401-6
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
PythonPYTHON社會媒體挖掘 本書特色
Python是非常適合數據科學家在中小型數據集上建造原型、可視化和分析數據的編程語言。本書將幫助你獲取和分析來自各大社會媒體網站的數據,展示如何使用科學的Python工具來挖掘Stack Exchange等流行社交網站。※ 通過公共API與社會媒體平臺進行交互※ 以方便的格式存儲社交數據以進行分析※ 使用Python數據科學工具對社交數據進行切片和分段※ 應用文本分析技術來理解人們在社會媒體上談論的內容※ 運用先進的統計和分析技術從數據中發現有用的見解※ 采用Web技術進行可視化,以探索數據和呈現數據產品
PythonPYTHON社會媒體挖掘 內容簡介
本書共分為9章,從社會媒體API、數據挖掘技巧和Python的數據科學工具這3個主題進行闡釋。主要內容包括:如何用Python通過公共API與社會媒體平臺交互,如何以方便的格式為數據分析存儲社會媒體數據,如何使用Python數據科學工具分割社會媒體數據,如何用文本分析方法理解社會媒體數據,如何用優選的統計和分析手段從海量數據中挖掘出有用信息,以及如何用Web技術來可視化數據。
PythonPYTHON社會媒體挖掘 目錄
1.1 入門 1
1.2 社會媒體——機遇和挑戰 2
1.2.1 機遇 3
1.2.2 挑戰 4
1.2.3 社會媒體挖掘技術 7
1.3 Python的數據科學工具 10
1.3.1 Python開發環境的安裝 11
1.3.2 高效的數據分析 14
1.3.3 機器學習 17
1.3.4 自然語言處理 21
1.3.5 社會網絡分析 25
1.3.6 數據可視化 26
1.4 Python中的數據處理 28
1.5 創建復雜的數據管道 29
1.6 小結 30
第 2章 Twitter數據挖掘——標簽、話題和時間序列 31
2.1 入門 31
2.2 Twitter API 32
2.2.1 接口訪問頻率限制 32
2.2.2 搜索與流 33
2.3 從Twitter收集數據 34
2.3.1 從時間線獲取推文 35
2.3.2 推文的結構 38
2.3.3 使用流API 42
2.4 分析推文——實體分析 44
2.5 分析推文——文本分析 48
2.6 分析推文——時間序列分析 54
2.7 小結 57
第3章 Twitter用戶、粉絲和社區 58
3.1 用戶、好友和粉絲 58
3.1.1 回到Twitter API 58
3.1.2 用戶資料的結構 59
3.1.3 下載好友和粉絲的資料 62
3.1.4 分析你的社會網絡 64
3.1.5 度量影響力和參與度 68
3.2 挖掘粉絲 72
3.3 挖掘對話 77
3.4 在地圖上繪制推文 80
3.4.1 將推文轉換為GeoJSON 80
3.4.2 用Folium輕松繪制地圖 83
3.5 小結 89
第4章 Facebook帖子、頁面和用戶互動 90
4.1 Facebook Graph API 90
4.1.1 注冊你的應用 90
4.1.2 鑒權和安全 92
4.1.3 用Python連接Facebook Graph API 93
4.2 挖掘你的帖子 96
4.2.1 帖子的結構 99
4.2.2 時間頻率分析 99
4.3 挖掘Facebook頁面 101
4.3.1 從頁面獲取帖子 103
4.3.2 度量參與度 107
4.3.3 用詞云可視化帖子 112
4.4 小結 114
第5章 Google+話題分析 115
5.1 Google+ API入門 115
5.2 在Web GUI中嵌入搜索結果 120
5.2.1 Python的裝飾器 121
5.2.2 Flask路由和模板 122
5.3 Google+頁面的筆記和活動 125
5.4 筆記的文本分析和TF-IDF計算 127
5.5 小結 134
第6章 Stack Exchange提問和回答 135
6.1 提問和回答 135
6.2 Stack Exchange API入門 137
6.2.1 搜索帶標簽的問題 139
6.2.2 搜索用戶 142
6.3 處理Stack Exchange的存檔數據 144
6.4 問題標簽的文本分類 149
6.4.1 監督學習和文本分類 149
6.4.2 分類算法 153
6.4.3 評估 155
6.4.4 Stack Exchange數據的文本分類 157
6.4.5 在實時應用中嵌入分類器 161
6.5 小結 165
第7章 博客、RSS、維基百科和自然語言處理 166
7.1 博客和自然語言處理 166
7.2 從博客和網站獲取數據 166
7.2.1 使用WordPress.com API 167
7.2.2 使用Blogger API 170
7.2.3 解析RSS和Atom訂閱 173
7.2.4 從維基百科獲取數據 174
7.2.5 關于網絡爬取的一點建議 176
7.3 自然語言處理基礎 177
7.3.1 文本處理 177
7.3.2 信息抽取 185
7.4 小結 190
第8章 挖掘所有數據 191
8.1 很多社交API 191
8.2 挖掘YouTube上的視頻 191
8.3 挖掘GitHub上的開源軟件 196
8.4 挖掘Yelp上的本地商家 203
8.5 創建自定義的Python客戶端 208
8.6 小結 210
第9章 關聯數據和語義網 211
9.1 數據網 211
9.1.1 語義網詞匯 212
9.1.2 微格式 215
9.1.3 關聯數據和開放數據 216
9.1.4 RDF 217
9.1.5 JSON-LD格式 218
9.1.6 Schema.org 219
9.2 從DBpedia挖掘關系 220
9.3 挖掘地理坐標 222
9.3.1 從維基百科抽取地理數據 222
9.3.2 在Google Maps上繪制地理數據 225
9.4 小結 229
PythonPYTHON社會媒體挖掘 作者簡介
馬爾科·邦扎尼尼(Marco Bonzanini) 數據科學咨詢師,擁有倫敦瑪麗王后大學信息檢索專業博士學位,是PyData倫敦meetup及系列會議的合作組織者,在很多國際會議上做過演講,并且在PacktPub上教授“Python數據分析”和“實用Python數據科學技術”兩門課程。他在個人博上分享了很多技術主題,主要關于Python、文本分析和數據科學。
- >
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
- >
中國人在烏蘇里邊疆區:歷史與人類學概述
- >
有舍有得是人生
- >
小考拉的故事-套裝共3冊
- >
羅曼·羅蘭讀書隨筆-精裝
- >
隨園食單
- >
姑媽的寶刀
- >
史學評論