中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊

包郵 數據科學工程實踐

作者:郭繼東
出版社:電子工業出版社出版時間:2024-09-01
開本: 16開
本類榜單:教材銷量榜
中 圖 價:¥57.7(7.2折) 定價  ¥79.9 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

數據科學工程實踐 版權信息

數據科學工程實踐 內容簡介

本書是高等學校開設數據科學導論或工程實踐等課程的配套用書。本書不僅介紹了數據科學的基礎知識,還特別引入了探索性數據分析流程的相關內容,主要包括實踐平臺配置、數據預處理、數據存儲與管理、探索性數據分析、單模型學習算法、集成學習算法和數據可視化等;精心設計其中的函數應用實踐和綜合應用實踐,前者聚焦具體函數的解釋和應用,后者致力于實際問題解決思路的探討。讀者可以由淺入深地了解相關理論,逐步完成相關實驗內容,增強理論和實踐的連貫性認知,培養數據思維和動手實踐能力。 本書可作為高等學校各相關專業的數據科學導論或實踐等課程的配套教材,也可供對數據科學感興趣的讀者閱讀。

數據科學工程實踐 目錄

目錄 第1章 數據科學概述 11.1 數據科學簡介 11.1.1 基本概念及發展歷史 11.1.2 特點及應用領域 21.1.3 數據科學的過程 31.2 Python的安裝 51.3 常用工具包概述 71.4 Anaconda3的安裝 91.5 Jupyter Notebook的使用 101.5.1 Jupyter Notebook簡介 101.5.2 Jupyter Notebook的啟動 10目錄第1章 數據科學概述 1 1.1 數據科學簡介 1 1.1.1 基本概念及發展歷史 1 1.1.2 特點及應用領域 2 1.1.3 數據科學的過程 3 1.2 Python的安裝 5 1.3 常用工具包概述 7 1.4 Anaconda3的安裝 9 1.5 Jupyter Notebook的使用 10 1.5.1 Jupyter Notebook簡介 10 1.5.2 Jupyter Notebook 的啟動 10 1.5.3 新手如何快速上手Jupyter Notebook 10 1.6 本章小結 12 課后習題 12 第2章 數據預處理 13 2.1 NumPy數據處理及運算 13 2.1.1 NumPy的安裝 13 2.1.2 創建N維數組 14 2.1.3 NumPy切片和索引 19 2.1.4 NumPy數組操作 20 2.1.5 數學函數 32 2.1.6 統計函數 40 2.1.7 排序函數 46 2.1.8 直方圖函數 47 2.2 Pandas基礎 49 2.2.1 數據快捷加載 49 2.2.2 Pandas的數據結構 53 2.3 非數值數據轉換 61 2.3.1 map()函數 61 2.3.2 One-Hot編碼 62 2.4 數據清洗 63 2.4.1 缺失值處理 63 2.4.2 錯誤數據替換 65 2.4.3 數據去重 65 2.4.4 數據合并連接 66 2.4.5 數據分組及聚合 70 2.5 本章小結 72 課后習題 72 第3章 數據存儲與管理 74 3.1 概述 74 3.1.1 數據存儲的概念 74 3.1.2 數據管理技術的概念 74 3.1.3 數據庫的概念 74 3.1.4 新型數據管理系統 75 3.2 關系數據庫 75 3.2.1 關系數據模型 75 3.2.2 應用舉例 76 3.3 分布式文件系統 78 3.3.1 HDFS的概念及特點 78 3.3.2 HDFS數據文件存儲 78 3.3.3 HDFS的結構及組件 78 3.3.4 HDFS的讀/寫操作 79 3.3.5 Python訪問HDFS 81 3.4 分布式數據庫 82 3.4.1 HBase的特點 82 3.4.2 HBase相關概念 82 3.4.3 HBase架構 82 3.4.4 Python操作HBase 84 3.5 流數據 87 3.5.1 流數據概述 87 3.5.2 流數據模型 87 3.5.3 流數據處理系統 88 3.6 本章小結 90 課后習題 90 第4章 探索性數據分析 92 4.1 EDA簡介 92 4.2 特征創建 98 4.3 維度約簡 101 4.3.1 為什么要降維 101 4.3.2 基于特征轉換的降維 102 4.3.3 基于特征選擇的降維 122 4.3.4 基于特征組合的降維 135 4.4 異常值檢測及處理 141 4.4.1 單變量異常檢測 141 4.4.2 OneClassSVM 143 4.4.3 EllipticEnvelope 145 4.5 評價函數 149 4.5.1 多標簽分類 149 4.5.2 二分類 151 4.5.3 回歸 155 4.6 測試和驗證 156 4.7 交叉驗證 159 4.7.1 建立自定義評分函數 160 4.7.2 使用交叉驗證迭代器 162 4.8 超參數調優 167 4.8.1 超參數調優概述 167 4.8.2 超參數調優實踐 174 4.9 小結 190 課后習題 190 第5章 單模型學習算法 191 5.1 概述 191 5.1.1 分類模型和回歸模型 192 5.1.2 機器學習的步驟和 要素 193 5.2 線性回歸和邏輯回歸 194 5.2.1 從線性回歸到邏輯 回歸 195 5.2.2 線性回歸實踐 197 5.2.3 Sigmoid函數 199 5.2.4 推廣至多元場景 200 5.2.5 邏輯回歸實踐 201 5.2.6 算法小結 203 進階A 交叉熵損失函數和平方差 損失函數 203 5.3 樸素貝葉斯分類 207 5.3.1 樸素貝葉斯分類算法 207 5.3.2 樸素貝葉斯實踐 210 5.3.3 算法小結 212 5.4 *近鄰算法 212 5.4.1 k近鄰算法的概念及 原理 212 5.4.2 k值的選取及特征歸一化的重要性 213 5.4.3 *近鄰算法實踐 215 5.4.4 算法小結 228 進階B kd樹 228 B.1 kd樹的構建 228 B.2 kd樹的搜索 230 B.3 kd樹的不足 232 5.5 支持向量機 233 5.5.1 支持向量機基礎 234 5.5.2 軟間隔 236 5.5.3 核函數 236 5.5.4 支持向量機實踐 238 5.5.5 算法小結 256 進階C 對偶問題 257 C.1 拉格朗日乘子法 257 C.2 支持向量機優化 259 進階D 軟間隔情況下的*優化問題 及其求解 260 5.6 決策樹 261 5.6.1 信息論知識 261 5.6.2 決策樹基礎 264 5.6.3 決策樹實踐 268 5.6.4 算法小結 285 5.7 聚類 286 5.7.1 K均值聚類 286 5.7.2 小批量KMeans 296 5.7.3 Affinity Propagation聚類 算法 299 5.7.4 層次聚類 301 5.7.5 DBSCAN 307 5.7.6 算法小結 310 5.8 本章小結 311 課后習題 311 第6章 集成學習算法 312 6.1 集成學習能帶來什么 312 6.1.1 集成學習的基本步驟 313 6.1.2 集成學習中的偏差與 方差 314 6.2 Bagging元學習器 320 6.3 隨機森林 326 6.3.1 隨機森林算法 327 6.3.2 極度隨機化樹 327 6.3.3 隨機森林實踐 328 6.3.4 算法小結 332 6.4 Boosting算法 332 6.5 AdaBoost算法 333 6.5.1 AdaBoost實踐 334 6.5.2 算法小結 341 進階E AdaBoost算法偽代碼 342 6.6 GBDT算法 342 6.6.1 分類和回歸 347 6.6.2 GBDT實踐 349 6.7 基于直方圖的梯度提升 351 6.7.1 用法 351 6.7.2 直方圖梯度提升模型 實踐 353 6.8 堆疊泛化 356 6.9 概率校準 358 6.9.1 校準曲線 359 6.9.2 校準分類器 362 6.10 本章小結 373 課后習題 373 第7章 數據可視化 374 7.1 可視化的定義及作用 374 7.2 可視化的原則 375 7.3 常用的可視化分析技術與 工具 375 7.4 Matplotlib繪圖 378 7.4.1 繪制曲線 378 7.4.2 繪制散點圖 384 7.4.3 繪制直方圖 385 7.4.4 繪制柱狀圖 387 7.4.5 繪制箱線圖 392 7.4.6 繪制圖像 394 7.4.7 繪制矩陣 396 7.5 Pandas繪圖 398 7.6 Scikit-learn繪圖 401 7.6.1 學習曲線 401 7.6.2 驗證曲線 405 7.6.3 ROC曲線 407 7.6.4 混淆矩陣 408 7.6.5 精確率-召回率曲線 410 7.6.6 部分依賴關系圖 412 7.7 本章小結 414 課后習題 414
展開全部

數據科學工程實踐 作者簡介

郭繼東,山東財經大學副教授,郭繼東博士在計算機視覺、人工智能、最優化方法、數據分析與挖掘算法和矩陣分析方面有著比較深入的研究,并取得了一些創新性的研究成果。主要研究方向為人工智能、計算機視覺、最優化方法、軟件架構設計、數據挖掘技術、三維重建、圖像處理等。在國內外重要學術刊物及會議上發表重要學術論文20余篇,其中有多篇被SCI或EI收錄。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 中央空调维修、中央空调保养、螺杆压缩机维修-苏州东菱空调 | 海峰资讯 - 专注装饰公司营销型网站建设和网络营销培训 | 外贸资讯网 - 洞悉全球贸易,把握市场先机 | ERP企业管理系统永久免费版_在线ERP系统_OA办公_云版软件官网 | 棉柔巾代加工_洗脸巾oem_一次性毛巾_浴巾生产厂家-杭州禾壹卫品科技有限公司 | 食安观察网| 氮化镓芯片-碳化硅二极管 - 华燊泰半导体 | 综合管廊模具_生态,阶梯护坡模具_检查井模具制造-致宏模具厂家 | 水成膜泡沫灭火剂_氟蛋白泡沫液_河南新乡骏华消防科技厂家 | 南京PVC快速门厂家南京快速卷帘门_南京pvc快速门_世界500强企业国内供应商_南京美高门业 | 北京发电车出租-发电机租赁公司-柴油发电机厂家 - 北京明旺盛安机电设备有限公司 | 酒吧霸屏软件_酒吧霸屏系统,酒吧微上墙,夜场霸屏软件,酒吧点歌软件,酒吧互动游戏,酒吧大屏幕软件系统下载 | 分光色差仪,测色仪,反透射灯箱,爱色丽分光光度仪,美能达色差仪维修_苏州欣美和仪器有限公司 | 耐腐蚀泵,耐腐蚀真空泵,玻璃钢真空泵-淄博华舜耐腐蚀真空泵有限公司 | 专注氟塑料泵_衬氟泵_磁力泵_卧龙泵阀_化工泵专业品牌 - 梭川泵阀 | 长沙广告公司_制作,长沙喷绘_发光字_招牌制作_长沙泓润广告官网 长城人品牌官网 | 集菌仪厂家_全封闭_封闭式_智能智能集菌仪厂家-上海郓曹 | 盘扣式脚手架-附着式升降脚手架-移动脚手架,专ye承包服务商 - 苏州安踏脚手架工程有限公司 | 冷库安装厂家_杭州冷库_保鲜库建设-浙江克冷制冷设备有限公司 | 黑龙江「京科脑康」医院-哈尔滨失眠医院_哈尔滨治疗抑郁症医院_哈尔滨精神心理医院 | 广东健伦体育发展有限公司-体育工程配套及销售运动器材的体育用品服务商 | 间甲酚,间甲酚厂家-山东祥东新材料 | 洛阳装修公司-洛阳整装一站式品牌-福尚云宅装饰 | 精密模具制造,注塑加工,吹塑和吹瓶加工,EPS泡沫包装生产 - 济南兴田塑胶有限公司 | 企业微信scrm管理系统_客户关系管理平台_私域流量运营工具_CRM、ERP、OA软件-腾辉网络 | 亿立分板机_曲线_锯片式_走刀_在线式全自动_铣刀_在线V槽分板机-杭州亿协智能装备有限公司 | 作文导航网_作文之家_满分作文_优秀作文_作文大全_作文素材_最新作文分享发布平台 | 防腐木批发价格_深圳_惠州_东莞防腐木厂家_森源(深圳)防腐木有限公司 | 工业铝型材生产厂家_铝合金型材配件批发精加工定制厂商 - 上海岐易铝业 | 高通量组织研磨仪-多样品组织研磨仪-全自动组织研磨仪-研磨者科技(广州)有限公司 | 吸音板,隔音板,吸音材料,吸音板价格,声学材料 - 佛山诺声吸音板厂家 | 污水处理设备维修_污水处理工程改造_机械格栅_过滤设备_气浮设备_刮吸泥机_污泥浓缩罐_污水处理设备_污水处理工程-北京龙泉新禹科技有限公司 | 重庆磨床过滤机,重庆纸带过滤机,机床伸缩钣金,重庆机床钣金护罩-重庆达鸿兴精密机械制造有限公司 | 24位ADC|8位MCU-芯易德科技有限公司 | 升降机-高空作业车租赁-蜘蛛车-曲臂式伸缩臂剪叉式液压升降平台-脚手架-【普雷斯特公司厂家】 | 阿尔法-MDR2000无转子硫化仪-STM566 SATRA拉力试验机-青岛阿尔法仪器有限公司 | 列管冷凝器,刮板蒸发器,外盘管反应釜厂家-无锡曼旺化工设备有限公司 | 郑州外墙清洗_郑州玻璃幕墙清洗_郑州开荒保洁-河南三恒清洗服务有限公司 | 澳门精准正版免费大全,2025新澳门全年免费,新澳天天开奖免费资料大全最新,新澳2025今晚开奖资料,新澳马今天最快最新图库-首页-东莞市傲马网络科技有限公司 | 云南丰泰挖掘机修理厂-挖掘机维修,翻新,再制造的大型企业-云南丰泰工程机械维修有限公司 | 临沂招聘网_人才市场_招聘信息_求职招聘找工作请认准【马头商标】 |