中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >>
數據科學與大數據技術導論

包郵 數據科學與大數據技術導論

出版社:人民郵電出版社出版時間:2021-02-01
開本: 26cm 頁數: 232頁
本類榜單:教材銷量榜
中 圖 價:¥41.8(8.4折) 定價  ¥49.8 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

數據科學與大數據技術導論 版權信息

數據科學與大數據技術導論 本書特色

1.詳細介紹數據科學的基本概念和內涵2.培養讀者初步具備用開源工具進行數據分析的能力3.培訓讀者了解大數據技術的框架,為今后系統學習打下基礎4.培養讀者對大數據分析的興趣,愿意為從事該領域的工作進一步學習

數據科學與大數據技術導論 內容簡介

本書是高校的大數據導論課程教材, 清楚地介紹了大數據相關的概念、理論、術語與基礎技術, 并使用真實連貫的商業案例以及簡單的圖表, 幫助讀者更清晰地理解大數據技術。

數據科學與大數據技術導論 目錄

第1章 數據科學概論 1
1.1 數據與大數據 1
1.2 大數據應用案例——從數據到知識,數據思維淺析 2
1.2.1 數據密集型科學發現 3
1.2.2 電子商務與推薦技術 5
1.2.3 網絡輿情管理 6
1.2.4 數據思維 7
1.3 數據科學與數據科學家 7
1.4 數據科學與大數據技術課程的內容體系與具體內容 11
1.5 思考題 12
第2章 Python語言與數據科學 13
2.1 Python概述 13
2.2 Python開發環境配置 14
2.3 變量、常量和注釋 16
2.4 數據類型 16
2.4.1 布爾型 17
2.4.2 整數 17
2.4.3 浮點數 17
2.4.4 字符串 17
2.4.5 列表 18
2.4.6 元組 19
2.4.7 字典 19
2.5 運算符及其優先級、表達式 20
2.6 程序的基本結構 21
2.6.1 順序結構 21
2.6.2 分支結構 22
2.6.3 循環結構 22
2.6.4 編寫完整的程序 23
2.6.5 程序實例:二分查找 24
2.7 函數以及庫函數 24
2.8 面向對象編程 27
2.8.1 構造函數 28
2.8.2 對象的摧毀和垃圾回收 28
2.8.3 繼承 28
2.8.4 重寫 28
2.9 異常處理 29
2.10 第三方庫和實例 29
2.10.1 機器學習庫scikit-learn簡介 30
2.10.2 深度學習庫Keras簡介 30
2.10.3 繪圖庫matplotlib簡介 30
2.10.4 社交網絡與圖數據處理庫networkX簡介 31
2.10.5 自然語言處理庫NLTK簡介 31
2.10.6 pandas庫入門 31
2.11 思考題 38
第3章 數據分析基礎 39
3.1 數據模型 39
3.1.1 數組 39
3.1.2 圖 42
3.1.3 關系模型 44
3.1.4 時序模型 45
3.2 數據分析流程與數據生命期 45
3.2.1 業務理解 45
3.2.2 數據理解 46
3.2.3 數據準備 46
3.2.4 建模 46
3.2.5 評估 47
3.2.6 部署 47
3.3 數據分析的基礎方法 47
3.3.1 描述性分析 47
3.3.2 診斷性分析 48
3.3.3 預測性分析 48
3.3.4 規范分析 49
3.4 大數據平臺 49
3.4.1 Hadoop 49
3.4.2 Hive 51
3.4.3 Mahout 52
3.4.4 Spark 52
3.4.5 Storm 53
3.4.6 Flink 53
3.4.7 Neo4j 54
3.5 思考題 54
第4章 數據可視化 55
4.1 可視化的定義 55
4.2 可視化發展歷程 55
4.3 可視化的意義和價值 57
4.4 數據可視化的流程 59
4.5 常見可視化圖表 59
4.5.1 柱狀圖 60
4.5.2 折線圖 61
4.5.3 餅圖 61
4.5.4 散點圖 61
4.5.5 雷達圖 61
4.6 可視化圖表工具 62
4.7 思考題 64
第5章 數據分析與計算 65
5.1 機器學習簡介 65
5.2 分類 67
5.2.1 支持向量機 67
5.2.2 決策樹 70
5.2.3 樸素貝葉斯方法 72
5.2.4 K*近鄰(KNN)算法 75
5.2.5 邏輯斯蒂回歸 76
5.2.6 分類算法的實例 77
5.3 聚類 81
5.3.1 K-Means算法 81
5.3.2 DBSCAN算法 83
5.3.3 聚類實例 85
5.4 回歸 88
5.4.1 線性回歸與多元線性回歸 88
5.4.2 回歸實例 90
5.5 關聯規則分析 92
5.5.1 關聯規則分析 92
5.5.2 關聯規則分析實例 95
5.6 推薦 97
5.6.1 基于用戶的協同過濾推薦 98
5.6.2 基于項目的協同過濾推薦 100
5.7 神經網絡與深度學習 101
5.7.1 神經網絡 101
5.7.2 深度學習 104
5.7.3 神經網絡與深度學習實例 112
5.8 云計算平臺與主流大數據平臺 119
5.8.1 云計算平臺 119
5.8.2 Hadoop大數據處理平臺與MapReduce計算模型 121
5.8.3 Spark大數據處理平臺與DAG計算模型 128
5.9 思考題 134
第6章 文本分析 135
6.1 文本分析的背景和意義 135
6.2 文本表達 136
6.2.1 單詞的局域性表示和分布式表示 136
6.2.2 基于話題模型的文本表示 139
6.2.3 基于詞嵌入的文本表示 139
6.3 文本聚類 140
6.3.1 聚類分析問題描述 141
6.3.2 常用聚類算法 142
6.4 文本分類 144
6.4.1 分類問題定義 144
6.4.2 主要文本分類方法 144
6.5 思考題 149
第7章 數據存儲與管理 150
7.1 數據管理的初級階段——文件管理 150
7.2 層次數據庫和網狀數據庫 151
7.3 關系數據庫管理系統 153
7.3.1 關系數據模型 153
7.3.2 數據操作 154
7.3.3 事務處理、并發控制和恢復技術 155
7.3.4 SQL入門 156
7.4 NoSQL數據庫 160
7.4.1 CAP理論與NoSQL數據庫 160
7.4.2 Key Value數據庫 161
7.4.3 Column Family數據庫 164
7.4.4 Document數據庫 165
7.4.5 Graph數據庫 166
7.5 NewSQL及其代表VoltDB 167
7.5.1 事務的串行執行 167
7.5.2 通過存儲過程存取數據庫 167
7.5.3 數據分區策略考慮盡量避免跨節點數據通信 168
7.5.4 命令日志與恢復技術 168
7.6 思考題 168
第8章 數據采集與集成 170
8.1 數據采集 170
8.1.1 數據采集的重要因素 171
8.1.2 推-拉機制 171
8.1.3 發布-訂閱機制 172
8.1.4 大數據收集系統 172
8.1.5 自定義連接器 173
8.2 信息抽取 173
8.2.1 信息抽取概述 174
8.2.2 半結構化數據和非結構化數據 174
8.2.3 信息抽取的關鍵技術 176
8.3 數據清洗 178
8.3.1 數據清洗的定義及對象 178
8.3.2 數據清洗原理 179
8.3.3 數據清洗方法 179
8.4 數據集成 181
8.4.1 數據集成概述 182
8.4.2 數據集成方法 183
8.4.3 數據集成的數據源異構問題 186
8.5 思考題 188
第9章 數據治理 189
9.1 數據治理的業務驅動力 189
9.2 數據治理的概念 190
9.3 數據治理的目標 191
9.3.1 實現價值 191
9.3.2 管控風險 192
9.4 數據治理的要素和框架 192
9.4.1 人員要素 194
9.4.2 技術要素 196
9.5 數據治理的實踐 201
9.5.1 各個業務子系統的建設和數據治理同步推進 201
9.5.2 建立數據治理的組織機構,確定數據治理戰略/政策和標準 201
9.5.3 規劃具體的數據治理任務 201
9.5.4 開展數據治理工作 202
9.5.5 數據治理的評價 203
9.6 大數據時代數據治理的挑戰 203
9.7 思考題 204
第10章 數據科學綜合案例 205
10.1 利用現成分類器對Twitter數據集進行情感分類 206
10.2 如何自行構造一個文本分類器 209
10.3 綜合實例 218
10.4 思考題 232
參考文獻 233
展開全部

數據科學與大數據技術導論 作者簡介

杜小勇,中國人民大學信息學院教授,博士生導師。我國著名的數據庫專家,曾擔任過國家863計劃數據庫重大專項專家組組長,現為中國計算機學會數據庫專業委員會主任。致力于數據庫系統核心技術的研發與成果轉化,科研成果先后獲得過北京市科技進步一等獎,中國計算機學會科學技術一等獎,以及教育部科技進步一等獎等。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 天津热油泵_管道泵_天津高温热油泵-天津市金丰泰机械泵业有限公司【官方网站】 | 干式变压器厂_干式变压器厂家_scb11/scb13/scb10/scb14/scb18干式变压器生产厂家-山东科锐变压器有限公司 | 杭州中央空调维修_冷却塔/新风机柜/热水器/锅炉除垢清洗_除垢剂_风机盘管_冷凝器清洗-杭州亿诺能源有限公司 | 拉力测试机|材料拉伸试验机|电子拉力机价格|万能试验机厂家|苏州皖仪实验仪器有限公司 | 工程管道/塑料管材/pvc排水管/ppr给水管/pe双壁波纹管等品牌管材批发厂家-河南洁尔康建材 | 帽子厂家_帽子工厂_帽子定做_义乌帽厂_帽厂_制帽厂_帽子厂_浙江高普制帽厂 | 大_小鼠elisa试剂盒-植物_人Elisa试剂盒-PCR荧光定量试剂盒-上海一研生物科技有限公司 | 水厂污泥地磅|污泥处理地磅厂家|地磅无人值守称重系统升级改造|地磅自动称重系统维修-河南成辉电子科技有限公司 | 移动厕所租赁|移动卫生间|上海移动厕所租赁-家瑞租赁 | 钢衬玻璃厂家,钢衬玻璃管道 -山东东兴扬防腐设备有限公司 | 南京交通事故律师-专打交通事故的南京律师 | 鼓风干燥箱_真空烘箱_高温干燥箱_恒温培养箱-上海笃特科学仪器 | 雨燕360体育免费直播_雨燕360免费NBA直播_NBA篮球高清直播无插件-雨燕360体育直播 | 火锅底料批发-串串香技术培训[川禾川调官网] | 医用酒精_84消毒液_碘伏消毒液等医用消毒液-漓峰消毒官网 | 磁棒电感生产厂家-电感器厂家-电感定制-贴片功率电感供应商-棒形电感生产厂家-苏州谷景电子有限公司 | 刚性-柔性防水套管-橡胶伸缩接头-波纹管补偿器-启腾供水材料有限公司 | 沈阳庭院景观设计_私家花园_别墅庭院设计_阳台楼顶花园设计施工公司-【沈阳现代时园艺景观工程有限公司】 | 橡胶电子拉力机-塑料-微电脑电子拉力试验机厂家-江苏天源 | 半容积式换热器_北京浮动盘管换热器厂家|北京亿丰上达 | 房车价格_依维柯/大通/东风御风/福特全顺/江铃图片_云梯搬家车厂家-程力专用汽车股份有限公司 | 硫化罐-电加热蒸汽硫化罐生产厂家-山东鑫泰鑫智能装备有限公司 | 金库门,金库房,金库门厂家,金库门价格-河北特旺柜业有限公司 | 卫浴散热器,卫浴暖气片,卫生间背篓暖气片,华圣格浴室暖气片 | 洁净实验室工程-成都手术室净化-无尘车间装修-四川华锐净化公司-洁净室专业厂家 | 石英陶瓷,石英坩埚,二氧化硅陶瓷-淄博百特高新材料有限公司 | 澳门精准正版免费大全,2025新澳门全年免费,新澳天天开奖免费资料大全最新,新澳2025今晚开奖资料,新澳马今天最快最新图库 | 卫浴散热器,卫浴暖气片,卫生间背篓暖气片,华圣格浴室暖气片 | TPE塑胶原料-PPA|杜邦pom工程塑料、PPSU|PCTG材料、PC/PBT价格-悦诚塑胶 | 蒸汽热收缩机_蒸汽发生器_塑封机_包膜机_封切收缩机_热收缩包装机_真空机_全自动打包机_捆扎机_封箱机-东莞市中堡智能科技有限公司 | 真空泵厂家_真空泵机组_水环泵_旋片泵_罗茨泵_耐腐蚀防爆_中德制泵 | 尊享蟹太太美味,大闸蟹礼卡|礼券|礼盒在线预订-蟹太太官网 | 高光谱相机-近红外高光谱相机厂家-高光谱成像仪-SINESPEC 赛斯拜克 | 自动气象站_农业气象站_超声波气象站_防爆气象站-山东万象环境科技有限公司 | 流量卡中心-流量卡套餐查询系统_移动电信联通流量卡套餐大全 | 杭州|上海贴标机-百科 | T恤衫定做,企业文化衫制作订做,广告T恤POLO衫定制厂家[源头工厂]-【汉诚T恤定制网】 | 不锈钢列管式冷凝器,换热器厂家-无锡飞尔诺环境工程有限公司 | 健康管理师报考条件,考试时间,报名入口—首页 | 密封无忧网 _ 专业的密封产品行业信息网 | 开锐教育-学历提升-职称评定-职业资格培训-积分入户 |