中图网(原中国图书网):网上书店,中文字幕在线一区二区三区,尾货特色书店,中文字幕在线一区,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >>
數據科學與工程技術叢書:數據科學導論PYthon語言(原書第3版)

包郵 數據科學與工程技術叢書:數據科學導論PYthon語言(原書第3版)

出版社:機械工業出版社出版時間:2020-04-01
開本: 16開 頁數: 300
中 圖 價:¥55.5(7.0折) 定價  ¥79.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

數據科學與工程技術叢書:數據科學導論PYthon語言(原書第3版) 版權信息

數據科學與工程技術叢書:數據科學導論PYthon語言(原書第3版) 本書特色

本書對上一版內容進行了全面擴展和更新,將幫助你使用常見的Python庫成功地進行數據科學操作。本書提供了對Python核心軟件包的前沿見解,包括新版的Jupyter Notebook、Numpy、pandas和Scikit-learn等。 本書提供大量詳細的示例和大型混合數據集,可以幫助你掌握數據收集、數據改寫和分析、可視化和活動報告等基本統計技術。此外,書中還介紹了機器學習算法、分布式計算、預測模型調參和自然語言處理等高級數據科學主題,還介紹了深度學習和梯度提升方案(如XGBoost、LightGBM和CatBoost)等內容。 通過本書的學習,你將全面了解主要的機器學習算法、圖分析技術以及所有可視化工具和部署工具,使你可以更輕松地向數據科學專家和商業用戶展示數據處理結果。 通過閱讀本書,你將學到: ??在Windows、Mac和Linux系統上安裝數據科學工具箱 ??使用Scikit-learn庫提供的核心機器學習方法 ??通過數據操作、修復和探索來解決數據科學問題 ??學習先進的數據探索和操作技術 ??優化機器學習模型,以獲得*佳性能 ??進行圖的探索和聚集分析,充分利用數據中的聯系和連接

數據科學與工程技術叢書:數據科學導論PYthon語言(原書第3版) 內容簡介

本書首先介紹如何設置基本的數據科學工具箱,然后帶你進入數據改寫和預處理階段,這一部分主要是闡明所有與核心數據科學活動相關的數據分析過程,如數據加載、轉換、修復以及數據探索和處理等。通過主要的機器學習算法、圖形分析技術,以及所有易于表現結果的可視化工具,實現對數據科學的概述。 本書對上一版內容進行了全面拓展和更新,涵蓋新版的Jupyter Notebook、NumPy、pandas和Scikit-learn等的新改進。此外,還介紹了深度學習(借助在Theano和Tensorflow平臺上運行的Keras庫)、漂亮的可視化(使用Seaborn和 ggplot)和Web部署(使用bottle)等新內容。 本書行文過程以數據科學項目為主體,輔以整潔的代碼和簡化的示例,能幫助你理解與項目相關的潛在原理和實際數據集。

數據科學與工程技術叢書:數據科學導論PYthon語言(原書第3版) 目錄

譯者序
前言
作者簡介
審閱者簡介
第1章 新手上路1
1.1 數據科學與Python簡介1
1.2 Python的安裝2
1.2.1 Python 2還是Python 33
1.2.2 分步安裝4
1.2.3 安裝必要的工具包4
1.2.4 工具包升級6
1.3 科學計算發行版6
1.3.1 Anaconda7
1.3.2 使用conda安裝工具包7
1.3.3 Enthought Canopy8
1.3.4 WinPython8
1.4 虛擬環境8
1.5 核心工具包一瞥11
1.6 Jupyter簡介18
1.6.1 快速安裝與初次使用21
1.6.2 Jupyter魔術命令22
1.6.3 直接從Jupyter Notebook安裝軟件包23
1.6.4 查看新的JupyterLab環境24
1.6.5 Jupyter Notebook怎樣幫助數據科學家24
1.6.6 Jupyter的替代版本29
1.7 本書使用的數據集和代碼30
1.7.1 Scikit-learn小規模數據集30
1.7.2 MLdata.org和其他公共資源庫32
1.7.3 LIBSVM Data樣本33
1.7.4 直接從CSV或文本文件加載數據33
1.7.5 Scikit-learn樣本生成器35
1.8 小結36
第2章 數據改寫37
2.1 數據科學過程37
2.2 使用pandas進行數據加載與預處理39
2.2.1 數據快捷加載39
2.2.2 處理問題數據41
2.2.3 處理大數據集43
2.2.4 訪問其他的數據格式46
2.2.5 合并數據48
2.2.6 數據預處理51
2.2.7 數據選擇55
2.3 使用分類數據和文本數據57
2.3.1 特殊的數據類型—文本59
2.3.2 使用Beautiful Soup抓取網頁64
2.4 使用Numpy進行數據處理65
2.4.1 NmuPy中的N維數組65
2.4.2 NmuPy ndarray對象基礎66
2.5 創建Numpy數組68
2.5.1 從列表到一維數組68
2.5.2 控制內存大小69
2.5.3 異構列表70
2.5.4 從列表到多維數組70
2.5.5 改變數組大小71
2.5.6 利用NumPy函數生成數組73
2.5.7 直接從文件中獲得數組73
2.5.8 從pandas提取數據74
2.6 NumPy快速操作和計算75
2.6.1 矩陣運算77
2.6.2 NumPy數組切片和索引78
2.6.3 NumPy數組堆疊80
2.6.4 使用稀疏數組81
2.7 小結83
第3章 數據科學流程84
3.1 EDA簡介84
3.2 創建新特征87
3.3 維數約簡89
3.3.1 協方差矩陣89
3.3.2 主成分分析90
3.3.3 一種用于大數據的PCA變型—RandomizedPCA93
3.3.4 潛在因素分析94
3.3.5 線性判別分析94
3.3.6 潛在語義分析95
3.3.7 獨立成分分析95
3.3.8 核主成分分析96
3.3.9 T-分布鄰域嵌入算法97
3.3.10 受限波爾茲曼機98
3.4 異常檢測和處理99
3.4.1 單變量異常檢測99
3.4.2 EllipticEnvelope101
3.4.3 OneClassSVM104
3.5 驗證指標106
3.5.1 多標號分類107
3.5.2 二值分類109
3.5.3 回歸110
3.6 測試和驗證110
3.7 交叉驗證113
3.7.1 使用交叉驗證迭代器115
3.7.2 采樣和自舉方法116
3.8 超參數優化118
3.8.1 建立自定義評分函數120
3.8.2 減少網格搜索時間121
3.9 特征選擇123
3.9.1 基于方差的特征選擇123
3.9.2 單變量選擇124
3.9.3 遞歸消除125
3.9.4 穩定性選擇與基于L1的選擇126
3.10 將所有操作包裝成工作流程127
3.10.1 特征組合和轉換鏈接128
3.10.2 構建自定義轉換函數130
3.11 小結131
第4章 機器學習132
4.1 準備工具和數據集132
4.2 線性和邏輯回歸134
4.3 樸素貝葉斯136
4.4 K近鄰137
4.5 非線性算法139
4.5.1 基于SVM的分類算法140
4.5.2 基于SVM的回歸算法141
4.5.3 調整SVM(優化)142
4.6 組合策略144
4.6.1 基于隨機樣本的粘貼策略144
4.6.2 基于弱分類器的Bagging策略144
4.6.3 隨機子空間和隨機分片145
4.6.4 隨機森林和Extra-Trees145
4.6.5 從組合估計概率147
4.6.6 模型序列—AdaBoost148
4.6.7 梯度樹提升149
4.6.8 XGBoost150
4.6.9 LightGBM152
4.6.10 CatBoost155
4.7 處理大數據158
4.7.1 作為范例創建一些大數據集158
4.7.2 對容量的可擴展性159
4.7.3 保持速度161
4.7.4 處理多樣性162
4.7.5 隨機梯度下降概述163
4.8 自然語言處理一瞥164
4.8.1 詞語分詞164
4.8.2 詞干提取165
4.8.3 詞性標注166
4.8.4 命名實體識別166
4.8.5 停止詞167
4.8.6 一個完整的數據科學例子—文本分類168
4.9 無監督學習概覽169
4.9.1 K均值算法169
4.9.2 基于密度的聚類技術—DBSCAN172
4.9.3 隱含狄利克雷分布173
4.10 小結177
第5章 可視化、發現和結果178
5.1 matplotlib基礎介紹178
5.1.1 曲線繪圖179
5.1.2 繪制分塊圖180
5.1.3 數據中的關系散點圖181
5.1.4 直方圖182
5.1.5 柱狀圖183
5.1.6 圖像可視化184
5.1.7 pandas的幾個圖形示例186
5.1.8 通過平行坐標發現模式191
5.2 封裝matplotlib命令191
5.2.1 Seaborn簡介192
5.2.2 增強EDA性能196
5.3 高級數據學習表示200
5.3.1 學習曲線201
5.3.2 確認曲線202
5.3.3 隨機森林的特征重要性203
5.3.4 GBT部分依賴關系圖形205
5.3.5 創建MA-AAS預測服務器205
5.4 小結209
第6章 社交網絡分析210
6.1 圖論簡介210
6.2 圖的算法215
6.2.1 節點中心性的類型216
6.2.2 網絡劃分218
6.3 圖的裝載、輸出和采樣221
6.4
展開全部
商品評論(0條)
暫無評論……
書友推薦
本類暢銷
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 2-羟基泽兰内酯-乙酰蒲公英萜醇-甘草查尔酮A-上海纯优生物科技有限公司 | 闸阀_截止阀_止回阀「生产厂家」-上海卡比阀门有限公司 | 超声波焊接机_超音波熔接机_超声波塑焊机十大品牌_塑料超声波焊接设备厂家 | 混合反应量热仪-高温高压量热仪-微机差热分析仪DTA|凯璞百科 | 筛分机|振动筛分机|气流筛分机|筛分机厂家-新乡市大汉振动机械有限公司 | 江门流水线|江门工作台|江门市伟涛行工业设备有限公司 | 国际金融网_每日财经新资讯网 | 耐酸泵,耐腐蚀真空泵,耐酸真空泵-淄博华舜耐腐蚀真空泵有限公司 精密模具-双色注塑模具加工-深圳铭洋宇通 | 低粘度纤维素|混凝土灌浆料|有机硅憎水粉|聚羧酸减水剂-南京斯泰宝 | 联系我们-腾龙公司上分客服微信19116098882 | 澳门精准正版免费大全,2025新澳门全年免费,新澳天天开奖免费资料大全最新,新澳2025今晚开奖资料,新澳马今天最快最新图库-首页-东莞市傲马网络科技有限公司 | 同学聚会纪念册制作_毕业相册制作-成都顺时针宣传画册设计公司 | 西安展台设计搭建_西安活动策划公司_西安会议会场布置_西安展厅设计西安旭阳展览展示 | 万师讲师网-优质讲师培训师供应商,讲师认证,找讲师来万师 | 浙江富广阀门有限公司| LCD3D打印机|教育|桌面|光固化|FDM3D打印机|3D打印设备-广州造维科技有限公司 | Trimos测长机_测高仪_TESA_mahr,WYLER水平仪,PWB对刀仪-德瑞华测量技术(苏州)有限公司 | 特种电缆厂家-硅橡胶耐高温电缆-耐低温补偿导线-安徽万邦特种电缆有限公司 | 防火阀、排烟防火阀、电动防火阀产品生产销售商-德州凯亿空调设备有限公司 | 防腐储罐_塑料储罐_PE储罐厂家_淄博富邦滚塑防腐设备科技有限公司 | 船用烟火信号弹-CCS防汛救生圈-船用救生抛绳器(海威救生设备) | 金环宇|金环宇电线|金环宇电缆|金环宇电线电缆|深圳市金环宇电线电缆有限公司|金环宇电缆集团 | 耐酸碱胶管_耐腐蚀软管总成_化学品输送软管_漯河利通液压科技耐油耐磨喷砂软管|耐腐蚀化学软管 | 金属软管_不锈钢金属软管_巩义市润达管道设备制造有限公司 | 空调风机,低噪声离心式通风机,不锈钢防爆风机,前倾皮带传动风机,后倾空调风机-山东捷风风机有限公司 | 宝元数控系统|对刀仪厂家|东莞机器人控制系统|东莞安川伺服-【鑫天驰智能科技】 | 样品瓶(色谱样品瓶)百科-浙江哈迈科技有限公司 | 山东活动策划|济南活动公司|济南公关活动策划-济南锐嘉广告有限公司 | 岩石钻裂机-液压凿岩机-劈裂机-挖改钻_湖南烈岩科技有限公司 | 体检车_移动CT车_CT检查车_CT车_深圳市艾克瑞电气有限公司移动CT体检车厂家-深圳市艾克瑞电气有限公司 | 志高装潢官网-苏州老房旧房装修改造-二手房装修翻新 | 色油机-色母机-失重|称重式混料机-称重机-米重机-拌料机-[东莞同锐机械]精密计量科技制造商 | 云南丰泰挖掘机修理厂-挖掘机维修,翻新,再制造的大型企业-云南丰泰工程机械维修有限公司 | 瑞典Blueair空气净化器租赁服务中心-专注新装修办公室除醛去异味服务! | T恤衫定做,企业文化衫制作订做,广告T恤POLO衫定制厂家[源头工厂]-【汉诚T恤定制网】 | 北京网站建设公司_北京网站制作公司_北京网站设计公司-北京爱品特网站建站公司 | 深圳品牌设计公司-LOGO设计公司-VI设计公司-未壳创意 | 上海租车公司_上海包车_奔驰租赁_上海商务租车_上海谐焕租车 | 气动隔膜泵-电动隔膜泵-循环热水泵-液下排污/螺杆/管道/化工泵「厂家」浙江绿邦 | 高效节能电机_伺服主轴电机_铜转子电机_交流感应伺服电机_图片_型号_江苏智马科技有限公司 | 专业深孔加工_东莞深孔钻加工_东莞深孔钻_东莞深孔加工_模具深孔钻加工厂-东莞市超耀实业有限公司 |