中图网(原中国图书网):网上书店,中文字幕在线一区二区三区,尾货特色书店,中文字幕在线一区,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊

包郵 數據科學工程實踐

作者:郭繼東
出版社:電子工業出版社出版時間:2024-09-01
開本: 16開
本類榜單:教材銷量榜
中 圖 價:¥56.9(7.1折) 定價  ¥79.9 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

數據科學工程實踐 版權信息

數據科學工程實踐 內容簡介

本書是高等學校開設數據科學導論或工程實踐等課程的配套用書。本書不僅介紹了數據科學的基礎知識,還特別引入了探索性數據分析流程的相關內容,主要包括實踐平臺配置、數據預處理、數據存儲與管理、探索性數據分析、單模型學習算法、集成學習算法和數據可視化等;精心設計其中的函數應用實踐和綜合應用實踐,前者聚焦具體函數的解釋和應用,后者致力于實際問題解決思路的探討。讀者可以由淺入深地了解相關理論,逐步完成相關實驗內容,增強理論和實踐的連貫性認知,培養數據思維和動手實踐能力。 本書可作為高等學校各相關專業的數據科學導論或實踐等課程的配套教材,也可供對數據科學感興趣的讀者閱讀。

數據科學工程實踐 目錄

目錄 第1章 數據科學概述 11.1 數據科學簡介 11.1.1 基本概念及發展歷史 11.1.2 特點及應用領域 21.1.3 數據科學的過程 31.2 Python的安裝 51.3 常用工具包概述 71.4 Anaconda3的安裝 91.5 Jupyter Notebook的使用 101.5.1 Jupyter Notebook簡介 101.5.2 Jupyter Notebook的啟動 10目錄第1章 數據科學概述 1 1.1 數據科學簡介 1 1.1.1 基本概念及發展歷史 1 1.1.2 特點及應用領域 2 1.1.3 數據科學的過程 3 1.2 Python的安裝 5 1.3 常用工具包概述 7 1.4 Anaconda3的安裝 9 1.5 Jupyter Notebook的使用 10 1.5.1 Jupyter Notebook簡介 10 1.5.2 Jupyter Notebook 的啟動 10 1.5.3 新手如何快速上手Jupyter Notebook 10 1.6 本章小結 12 課后習題 12 第2章 數據預處理 13 2.1 NumPy數據處理及運算 13 2.1.1 NumPy的安裝 13 2.1.2 創建N維數組 14 2.1.3 NumPy切片和索引 19 2.1.4 NumPy數組操作 20 2.1.5 數學函數 32 2.1.6 統計函數 40 2.1.7 排序函數 46 2.1.8 直方圖函數 47 2.2 Pandas基礎 49 2.2.1 數據快捷加載 49 2.2.2 Pandas的數據結構 53 2.3 非數值數據轉換 61 2.3.1 map()函數 61 2.3.2 One-Hot編碼 62 2.4 數據清洗 63 2.4.1 缺失值處理 63 2.4.2 錯誤數據替換 65 2.4.3 數據去重 65 2.4.4 數據合并連接 66 2.4.5 數據分組及聚合 70 2.5 本章小結 72 課后習題 72 第3章 數據存儲與管理 74 3.1 概述 74 3.1.1 數據存儲的概念 74 3.1.2 數據管理技術的概念 74 3.1.3 數據庫的概念 74 3.1.4 新型數據管理系統 75 3.2 關系數據庫 75 3.2.1 關系數據模型 75 3.2.2 應用舉例 76 3.3 分布式文件系統 78 3.3.1 HDFS的概念及特點 78 3.3.2 HDFS數據文件存儲 78 3.3.3 HDFS的結構及組件 78 3.3.4 HDFS的讀/寫操作 79 3.3.5 Python訪問HDFS 81 3.4 分布式數據庫 82 3.4.1 HBase的特點 82 3.4.2 HBase相關概念 82 3.4.3 HBase架構 82 3.4.4 Python操作HBase 84 3.5 流數據 87 3.5.1 流數據概述 87 3.5.2 流數據模型 87 3.5.3 流數據處理系統 88 3.6 本章小結 90 課后習題 90 第4章 探索性數據分析 92 4.1 EDA簡介 92 4.2 特征創建 98 4.3 維度約簡 101 4.3.1 為什么要降維 101 4.3.2 基于特征轉換的降維 102 4.3.3 基于特征選擇的降維 122 4.3.4 基于特征組合的降維 135 4.4 異常值檢測及處理 141 4.4.1 單變量異常檢測 141 4.4.2 OneClassSVM 143 4.4.3 EllipticEnvelope 145 4.5 評價函數 149 4.5.1 多標簽分類 149 4.5.2 二分類 151 4.5.3 回歸 155 4.6 測試和驗證 156 4.7 交叉驗證 159 4.7.1 建立自定義評分函數 160 4.7.2 使用交叉驗證迭代器 162 4.8 超參數調優 167 4.8.1 超參數調優概述 167 4.8.2 超參數調優實踐 174 4.9 小結 190 課后習題 190 第5章 單模型學習算法 191 5.1 概述 191 5.1.1 分類模型和回歸模型 192 5.1.2 機器學習的步驟和 要素 193 5.2 線性回歸和邏輯回歸 194 5.2.1 從線性回歸到邏輯 回歸 195 5.2.2 線性回歸實踐 197 5.2.3 Sigmoid函數 199 5.2.4 推廣至多元場景 200 5.2.5 邏輯回歸實踐 201 5.2.6 算法小結 203 進階A 交叉熵損失函數和平方差 損失函數 203 5.3 樸素貝葉斯分類 207 5.3.1 樸素貝葉斯分類算法 207 5.3.2 樸素貝葉斯實踐 210 5.3.3 算法小結 212 5.4 *近鄰算法 212 5.4.1 k近鄰算法的概念及 原理 212 5.4.2 k值的選取及特征歸一化的重要性 213 5.4.3 *近鄰算法實踐 215 5.4.4 算法小結 228 進階B kd樹 228 B.1 kd樹的構建 228 B.2 kd樹的搜索 230 B.3 kd樹的不足 232 5.5 支持向量機 233 5.5.1 支持向量機基礎 234 5.5.2 軟間隔 236 5.5.3 核函數 236 5.5.4 支持向量機實踐 238 5.5.5 算法小結 256 進階C 對偶問題 257 C.1 拉格朗日乘子法 257 C.2 支持向量機優化 259 進階D 軟間隔情況下的*優化問題 及其求解 260 5.6 決策樹 261 5.6.1 信息論知識 261 5.6.2 決策樹基礎 264 5.6.3 決策樹實踐 268 5.6.4 算法小結 285 5.7 聚類 286 5.7.1 K均值聚類 286 5.7.2 小批量KMeans 296 5.7.3 Affinity Propagation聚類 算法 299 5.7.4 層次聚類 301 5.7.5 DBSCAN 307 5.7.6 算法小結 310 5.8 本章小結 311 課后習題 311 第6章 集成學習算法 312 6.1 集成學習能帶來什么 312 6.1.1 集成學習的基本步驟 313 6.1.2 集成學習中的偏差與 方差 314 6.2 Bagging元學習器 320 6.3 隨機森林 326 6.3.1 隨機森林算法 327 6.3.2 極度隨機化樹 327 6.3.3 隨機森林實踐 328 6.3.4 算法小結 332 6.4 Boosting算法 332 6.5 AdaBoost算法 333 6.5.1 AdaBoost實踐 334 6.5.2 算法小結 341 進階E AdaBoost算法偽代碼 342 6.6 GBDT算法 342 6.6.1 分類和回歸 347 6.6.2 GBDT實踐 349 6.7 基于直方圖的梯度提升 351 6.7.1 用法 351 6.7.2 直方圖梯度提升模型 實踐 353 6.8 堆疊泛化 356 6.9 概率校準 358 6.9.1 校準曲線 359 6.9.2 校準分類器 362 6.10 本章小結 373 課后習題 373 第7章 數據可視化 374 7.1 可視化的定義及作用 374 7.2 可視化的原則 375 7.3 常用的可視化分析技術與 工具 375 7.4 Matplotlib繪圖 378 7.4.1 繪制曲線 378 7.4.2 繪制散點圖 384 7.4.3 繪制直方圖 385 7.4.4 繪制柱狀圖 387 7.4.5 繪制箱線圖 392 7.4.6 繪制圖像 394 7.4.7 繪制矩陣 396 7.5 Pandas繪圖 398 7.6 Scikit-learn繪圖 401 7.6.1 學習曲線 401 7.6.2 驗證曲線 405 7.6.3 ROC曲線 407 7.6.4 混淆矩陣 408 7.6.5 精確率-召回率曲線 410 7.6.6 部分依賴關系圖 412 7.7 本章小結 414 課后習題 414
展開全部

數據科學工程實踐 作者簡介

郭繼東,山東財經大學副教授,郭繼東博士在計算機視覺、人工智能、最優化方法、數據分析與挖掘算法和矩陣分析方面有著比較深入的研究,并取得了一些創新性的研究成果。主要研究方向為人工智能、計算機視覺、最優化方法、軟件架構設計、數據挖掘技術、三維重建、圖像處理等。在國內外重要學術刊物及會議上發表重要學術論文20余篇,其中有多篇被SCI或EI收錄。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 上海恒驭仪器有限公司-实验室平板硫化机-小型平板硫化机-全自动平板硫化机 | 谷歌关键词优化-外贸网站优化-Google SEO小语种推广-思亿欧外贸快车 | 深圳激光打标机_激光打标机_激光焊接机_激光切割机_同体激光打标机-深圳市创想激光科技有限公司 深圳快餐店设计-餐饮设计公司-餐饮空间品牌全案设计-深圳市勤蜂装饰工程 | 带式过滤机厂家_价格_型号规格参数-江西核威环保科技有限公司 | 蓄电池回收,ups电池后备电源回收,铅酸蓄电池回收,机房电源回收-广州益夫铅酸电池回收公司 | 立式壁挂广告机厂家-红外电容触摸一体机价格-华邦瀛 | 钢格栅板_钢格板网_格栅板-做专业的热镀锌钢格栅板厂家-安平县迎瑞丝网制造有限公司 | 高温链条油|高温润滑脂|轴承润滑脂|机器人保养用油|干膜润滑剂-东莞卓越化学 | 【法利莱住人集装箱厂家】—活动集装箱房,集装箱租赁_大品牌,更放心 | 洛阳网站建设_洛阳网站优化_网站建设平台_洛阳香河网络科技有限公司 | 特种阀门-调节阀门-高温熔盐阀-镍合金截止阀-钛阀门-高温阀门-高性能蝶阀-蒙乃尔合金阀门-福建捷斯特阀门制造有限公司 | 微妙网,专业的动画师、特效师、CG模型设计师网站! - wmiao.com 超声波电磁流量计-液位计-孔板流量计-料位计-江苏信仪自动化仪表有限公司 | 联系我们-腾龙公司上分客服微信19116098882 | 天津次氯酸钠酸钙溶液-天津氢氧化钠厂家-天津市辅仁化工有限公司 | 对夹式止回阀厂家,温州对夹式止回阀制造商--永嘉县润丰阀门有限公司 | 盘扣式脚手架-附着式升降脚手架-移动脚手架,专ye承包服务商 - 苏州安踏脚手架工程有限公司 | 高柔性拖链电缆_卷筒电缆_耐磨耐折聚氨酯电缆-玖泰特种电缆 | 重庆小面培训_重庆小面技术培训学习班哪家好【终身免费复学】 | 高铝砖-高铝耐火球-高铝耐火砖生产厂家-价格【荣盛耐材】 | 河南膏药贴牌-膏药代加工-膏药oem厂家-洛阳今世康医药科技有限公司 | 济南画室培训-美术高考培训-山东艺霖艺术培训画室 | 汽车润滑油厂家-机油/润滑油代理-高性能机油-领驰慧润滑科技(河北)有限公司 | 聚合氯化铝-碱式氯化铝-聚合硫酸铁-聚氯化铝铁生产厂家多少钱一吨-聚丙烯酰胺价格_河南浩博净水材料有限公司 | 船老大板材_浙江船老大全屋定制_船老大官网 | 动库网动库商城-体育用品专卖店:羽毛球,乒乓球拍,网球,户外装备,运动鞋,运动包,运动服饰专卖店-正品运动品网上商城动库商城网 - 动库商城 | 润滑脂-高温润滑脂-轴承润滑脂-食品级润滑油-索科润滑油脂厂家 | 中矗模型-深圳中矗模型设计有限公司 | 考勤系统_考勤管理系统_网络考勤软件_政企|集团|工厂复杂考勤工时统计排班管理系统_天时考勤 | 密集架-手摇-智能-移动-价格_内蒙古档案密集架生产厂家 | 机制砂选粉机_砂石选粉机厂家-盐城市助成粉磨科技有限公司 | 巨野月嫂-家政公司-巨野县红墙安康母婴护理中心 | 致胜管家软件服务【在线免费体验】 | 齿式联轴器-弹性联轴器-联轴器厂家-江苏诺兴传动联轴器制造有限公司 | 大流量卧式砂磨机_强力分散机_双行星双动力混合机_同心双轴搅拌机-莱州市龙跃化工机械有限公司 | 尚为传动-专业高精密蜗轮蜗杆,双导程蜗轮蜗杆,蜗轮蜗杆减速机,蜗杆减速机生产厂家 | 广州监控安装公司_远程监控_安防弱电工程_无线wifi覆盖_泉威安防科技 | 数控走心机-双主轴走心机厂家-南京建克| 科研ELISA试剂盒,酶联免疫检测试剂盒,昆虫_植物ELISA酶免试剂盒-上海仁捷生物科技有限公司 | 企业微信scrm管理系统_客户关系管理平台_私域流量运营工具_CRM、ERP、OA软件-腾辉网络 | 玉米深加工设备-玉米深加工机械-新型玉米工机械生产厂家-河南粮院机械制造有限公司 | 北京征地律师,征地拆迁律师,专业拆迁律师,北京拆迁律师,征地纠纷律师,征地诉讼律师,征地拆迁补偿,拆迁律师 - 北京凯诺律师事务所 |