Python數(shù)據(jù)分析 版權(quán)信息
- ISBN:9787564188849
- 條形碼:9787564188849 ; 978-7-5641-8884-9
- 裝幀:一般膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>
Python數(shù)據(jù)分析 本書特色
《Python數(shù)據(jù)分析》將服務(wù)于初露頭角的數(shù)據(jù)科學(xué)家和開發(fā)人員,讓他們有興趣發(fā)展自己的技能,或者任何希望成為一名專業(yè)數(shù)據(jù)科學(xué)家的人。
本書提供了一種新的數(shù)據(jù)分析方法,與你分享全新、強大的Python工具、AI技術(shù)和開源庫。行業(yè)專家大衛(wèi)??塔伊布向你展示如何將數(shù)據(jù)科學(xué)與Python編程和算法的強大功能聯(lián)系起來。你將在數(shù)據(jù)分析中使用復(fù)雜的算法和*先進的人工智能技術(shù),了解如何使用Python工具和Jupyter Notebook通過實踐案例分析數(shù)據(jù),還可以找到理論和實踐之間的正確平衡,以及大量可以直接集成到自己的數(shù)據(jù)項目中的代碼文件。
Python數(shù)據(jù)分析 內(nèi)容簡介
本書《Python數(shù)據(jù)分析》提供了一種新的數(shù)據(jù)分析方法,與你分享近期新不錯大的Python工具、AI技術(shù)和開源庫。行業(yè)專家大衛(wèi)?塔勒布向你展示如何將數(shù)據(jù)科學(xué)與Python編程算法的強大功能聯(lián)系起來。你將在數(shù)據(jù)分析中使用復(fù)雜的算法和優(yōu)選進的人工智能技術(shù)。了解如何在實踐案例分析數(shù)據(jù)中使用Python工具和Jupyter筆記本。還可以體會理論和實踐的適當(dāng)平衡,以及大量可以直接集成到自己數(shù)據(jù)項目中的代碼文件。
Python數(shù)據(jù)分析 目錄
1 編程和數(shù)據(jù)科學(xué)——一個新的工具集
什么是數(shù)據(jù)科學(xué)
數(shù)據(jù)科學(xué)會長期存在嗎?
為什么數(shù)據(jù)科學(xué)正在興起?
數(shù)據(jù)科學(xué)與開發(fā)人員有什么關(guān)系?
將這些概念付諸實踐
深入研究一個具體的示例
數(shù)據(jù)管道藍圖
數(shù)據(jù)科學(xué)家應(yīng)該具備什么技能?
IBM Watson Deep QA
回到Twitter帶#標簽的情感分析項目
從構(gòu)建**條企業(yè)級數(shù)據(jù)管道中汲取的經(jīng)驗教訓(xùn)
數(shù)據(jù)科學(xué)策略
Jupyter Notebook是我們的戰(zhàn)略核心
為什么Notebook這么流行?
本章小結(jié)
2 Python和Jupyter Notebook為數(shù)據(jù)分析提供動力
為什么選擇Python?
PixieDust入門
SampleData——一個用于加載數(shù)據(jù)的簡單API
用pixiedust_rosie整理數(shù)據(jù)
Disp|ay——一個簡單的交互式數(shù)據(jù)可視化API
過濾
用PixieApp消除開發(fā)人員和數(shù)據(jù)科學(xué)家之間的壁壘
操作化數(shù)據(jù)科學(xué)分析的體系結(jié)構(gòu)
本章小結(jié)
3 使用Python庫加速數(shù)據(jù)分析
PixieAPP深度剖析
路由
生成路由請求
GitHub項目跟蹤示例程序
在表格中顯示搜索結(jié)果
使用pd_entity屬性調(diào)用PixieDust display()API
使用pd_script調(diào)用任意Python代碼
用pd_refresh讓應(yīng)用程序更具響應(yīng)性
創(chuàng)建可重用的小部件
本章小結(jié)
4 用PixieApp工具發(fā)布數(shù)據(jù)分析結(jié)果
Kubernetes概述
安裝和配置PixieGateway服務(wù)器
PixieGateway服務(wù)器配置
PixieGateway體系結(jié)構(gòu)
發(fā)布應(yīng)用程序
PixieApp URL中的編碼狀態(tài)
通過將圖表發(fā)布為網(wǎng)頁來共享它們
PixieGateway管理控制臺
Python控制臺
顯示PixieApp的預(yù)熱和運行代碼
本章小結(jié)
5 Python和PixieDust*佳實踐與高級概念
使用@captureOutput裝飾器集成第三方Python庫的輸出
使用@captureOutput創(chuàng)建詞云圖像
增加模塊化和代碼重用
使用pd widget創(chuàng)建小部件
PixieDust中的流式數(shù)據(jù)支持
向PixieApp添加流處理功能
添加帶有PixieApp事件的儀表盤下鉆功能
擴展PixieDust可視化
調(diào)試
使用pdb調(diào)試Jupyter Notebook
使用PixieDebugger進行可視化調(diào)試
使用PixieDebugger調(diào)試PixieApp路由
使用PixieDust日志記錄排除問題
客戶端調(diào)試
在Python筆記本中運行Node.js
本章小結(jié)
6 分析案例:人工智能與TensorFlow圖像識別
什么是機器學(xué)習(xí)?
什么是深度學(xué)習(xí)?
開始使用TensorFlow
用DNNClassifier進行簡單分類
圖像識別示例應(yīng)用程序
第1部分——加載預(yù)訓(xùn)練的MobileNet模型
第2部分——為我們的圖像識別示例應(yīng)用程序創(chuàng)建一個PixieAPP
第3部分——集成TensorBoard圖形可視化
第4部分——使用自定義訓(xùn)練數(shù)據(jù)重新訓(xùn)練模型
本章小結(jié)
7 分析案例:自然語言處理、大數(shù)據(jù)與Twitter情感分析
ApacheSpark入門
Apache Spark體系結(jié)構(gòu)
將Notebook配置為使用Spark
“Twitter情感分析”應(yīng)用程序
第1部分——以Spark Structured Streaming獲取數(shù)據(jù)
數(shù)據(jù)管道的體系結(jié)構(gòu)圖
Twitter的身份驗證
創(chuàng)建Twitter流
創(chuàng)建Spark Streaming DataFrame
創(chuàng)建和運行結(jié)構(gòu)化查詢
監(jiān)控活動流式查詢
從Parquet文件創(chuàng)建批量DataFrame
第2部分——用情感和提取的*相關(guān)實體來豐富數(shù)據(jù)
IBM Watson Natural Language Undersanding服務(wù)入門
第3部分——創(chuàng)建實時儀表盤
將分析重構(gòu)為它們自己的方法
創(chuàng)建PixieApp
第4部分——使用Apache Kafka和IBM Streams Designer添加可伸縮性
將原始推文流到Kafka
使用Streaming Analytics服務(wù)豐富推文數(shù)據(jù)
使用Kafka輸入源創(chuàng)建Spark Streaming DataFrame
本章小結(jié)
8 分析案例:預(yù)測——金融時間序列分析與預(yù)測
NumPy入門
創(chuàng)建NumPy數(shù)組
ndarray運算
NumPy數(shù)組的選擇操作
廣播
時間序列的統(tǒng)計探索
虛擬投資
自相關(guān)函數(shù)(ACF)和偏自相關(guān)函數(shù)(PACF)
將它們與StockExplorer PixieAPP放在一起
BaseSuhAPP——所有子PixieAPP的基類
StockExploreSubAPP——**個子PixieApp
MovingAverageSubAPP——第二個子PixieAPP
AutoCorrelationsubAPP——第三個子PixieApp
ARIMA模型在時間序列預(yù)測中的應(yīng)用
建立MSFT股票時間序列的ARIMA模型
StockExplorer PixieAPP第2部分——使用ARIMA模型添加時間序列預(yù)測
本章小結(jié)
9 分析案例:圖形算法——美國國內(nèi)航班數(shù)據(jù)分析
圖形概述
圖形表示
圖形算法
圖形和大數(shù)據(jù)
networkx圖形庫入門
創(chuàng)建圖形
可視化圖形
第1部分——將美國國內(nèi)航班數(shù)據(jù)加載到圖中
圖的中心性
第2部分——創(chuàng)建UsFlightsAnalysis PixieApp
第3部分——向USFlightsAnalysis PiXieApp添加數(shù)據(jù)探索功能
第4部分——創(chuàng)建預(yù)測航班延誤的ARIMA模型
本章小結(jié)
10 數(shù)據(jù)分析的未來與拓展技能的途徑
前瞻性思考——人工智能與數(shù)據(jù)科學(xué)的未來展望
參考資料
附錄 PixieApp快速參考
注釋
自定義HTML屬性
方法
展開全部
Python數(shù)據(jù)分析 作者簡介
David Taieb目前在亞馬遜擔(dān)任Principal Engineer(首席工程師),之前在IBM工作14年。曾經(jīng)是IBM Watson和云平臺開發(fā)人員布道師團隊的Distinguished Engineer(杰出工程師),領(lǐng)導(dǎo)一個技術(shù)專家組團隊向開發(fā)人員宣傳數(shù)據(jù)科學(xué)、人工智能和云技術(shù)。他著名的開源項目是PixieDust Python庫,致力于增強Jupyter筆記本可視化功能、支持scala spark與pyspark交互性,幫助開發(fā)人員提高工作效率。