中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
大數據分析:理論、方法及應用

包郵 大數據分析:理論、方法及應用

出版社:機械工業出版社出版時間:2022-05-01
開本: 16開 頁數: 336
中 圖 價:¥89.0(6.9折) 定價  ¥129.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

大數據分析:理論、方法及應用 版權信息

  • ISBN:9787111703471
  • 條形碼:9787111703471 ; 978-7-111-70347-1
  • 裝幀:一般膠版紙
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>

大數據分析:理論、方法及應用 本書特色

適讀人群 :數據科學和大數據相關專業學生及相關領域從業者本書對迅速興起的數據科學跨學科領域提供必要的介紹,重點介紹構建用于收集、分析和解釋數據的系統所需的關鍵技能,以及成為優秀數據科學家的基本原則。“正確地做簡單的事情”,幫助讀者發展數學直覺,用少的數學推導說明關鍵概念。本書使用計算機科學家自然的方法突出統計推理的核心價值,不依賴任何特定的編程語言或數據分析工具套件,而是側重于對重要設計原則的深入討論。 本書特色: ·包含“實戰故事”,為數據科學如何應用于現實世界提供參考。 ·強調“錯誤的開始”,揭示某些方法失敗的微妙原因。 ·提供“課后拓展”,強調每一章中需要特別注意的一些概念。 ·包括“練習”,為讀者自學提供廣泛的習題和項目。 ·“Kaggle挑戰”讓讀者挑戰現實世界中的問題。 本書對迅速興起的數據科學跨學科領域提供必要的介紹,重點介紹構建用于收集、分析和解釋數據的系統所需的關鍵技能,以及成為優秀數據科學家的基本原則。“正確地做簡單的事情”,幫助讀者發展數學直覺,用少的數學推導說明關鍵概念。本書使用計算機科學家自然的方法突出統計推理的核心價值,不依賴任何特定的編程語言或數據分析工具套件,而是側重于對重要設計原則的深入討論。 本書特色: ·包含“實戰故事”,為數據科學如何應用于現實世界提供參考。 ·強調“錯誤的開始”,揭示某些方法失敗的微妙原因。 ·提供“課后拓展”,強調每一章中需要特別注意的一些概念。 ·包括“練習”,為讀者自學提供廣泛的習題和項目。 ·“Kaggle挑戰”讓讀者挑戰現實世界中的問題。

大數據分析:理論、方法及應用 內容簡介

本書由算法領域的知名專家Steven Skiena教授撰寫,重點介紹了收集、分析和解釋數據所需的技能和原理。作者由淺入深地介紹了數據科學的概念、所需的數學基礎、數據的整理清洗方法、數據分析方法(統計分析、可視化、數學模型、線性邏輯回歸、機器學習算法等)以及學習大數據分析的意義。作者結合應用領域的大量數據分析案例,以解釋大數據分析所需技能與原理,幫助者快速理解和掌握大數據分析的理論與方法,也將這些技能的實際應用方式展現得淋漓盡致,具有很強的可操作性。

大數據分析:理論、方法及應用 目錄

譯者序
前言
第1章 什么是數據科學1
1.1 計算機科學、數據科學和真正的科學1
1.2 從數據中提出有趣的問題3
1.2.1 棒球百科全書3
1.2.2 互聯網電影數據庫6
1.2.3 Google Ngrams7
1.2.4 紐約出租車記錄9
1.3 數據的屬性11
1.3.1 結構化與非結構化數據11
1.3.2 定量數據與類別數據11
1.3.3 大數據與小數據12
1.4 分類與回歸12
1.5 關于數據科學的電視節目:The Quant Shop13
1.6 關于實戰故事15
1.7 實戰故事:回答正確的問題16
1.8 章節注釋17
1.9 練習17
第2章 數學基礎20
2.1 概率20
2.1.1 概率與統計21
2.1.2 復合事件與獨立事件22
2.1.3 條件概率23
2.1.4 概率分布23
2.2 描述性統計25
2.2.1 中心性度量25
2.2.2 變異性度量26
2.2.3 解釋方差27
2.2.4 描述分布29
2.3 相關性分析29
2.3.1 相關系數:皮爾遜和斯皮爾曼秩30
2.3.2 相關的強弱與顯著性31
2.3.3 相關性并不意味著因果關系33
2.3.4 用自相關檢測周期性34
2.4 對數35
2.4.1 對數與乘法概率35
2.4.2 對數和比率35
2.4.3 對數與正規化偏態分布36
2.5 實戰故事:契合設計師基因37
2.6 章節注釋39
2.7 練習39
第3章 數據整理42
3.1 數據科學語言42
3.1.1 notebook環境的重要性44
3.1.2 標準數據格式45
3.2 數據收集47
3.2.1 搜索47
3.2.2 爬取49
3.2.3 網絡日志50
3.3 數據清洗50
3.3.1 錯誤與偽影51
3.3.2 數據兼容性52
3.3.3 處理缺失值56
3.3.4 離群值檢測57
3.4 實戰故事:打敗市場58
3.5 眾包59
3.5.1 一便士的實驗59
3.5.2 什么時候有群體智慧60
3.5.3 聚合機制61
3.5.4 眾包服務62
3.5.5 游戲化65
3.6 章節注釋66
3.7 練習66
第4章 得分和排名69
4.1 體重指數70
4.2 開發評分系統72
4.2.1 黃金標準和代理72
4.2.2 排名與得分72
4.2.3 識別良好的評分函數74
4.3 Z得分和歸一化75
4.4 高級排名技術76
4.4.1 Elo排名76
4.4.2 合并排名78
4.4.3 基于有向圖的排名80
4.4.4 PageRank80
4.5 實戰故事:Clyde的復仇81
4.6 阿羅不可能性定理83
4.7 實戰故事:誰更大84
4.8 章節注釋87
4.9 練習87
第5章 統計分析89
5.1 統計分布90
5.1.1 二項分布90
5.1.2 正態分布91
5.1.3 正態分布的含義93
5.1.4 泊松分布93
5.1.5 冪律分布95
5.2 從分布中采樣97
5.3 統計顯著性99
5.3.1 顯著性的意義100
5.3.2 t檢驗:比較總體均值101
5.3.3 Kolmogorov-Smirnov檢驗102
5.3.4 Bonferroni校正104
5.3.5 錯誤發現率104
5.4 實戰故事:發現青春之泉105
5.5 置換檢驗與p值106
5.5.1 產生隨機排列108
5.5.2 迪馬吉奧的連勝紀錄109
5.6 貝葉斯定理110
5.7 章節注釋111
5.8 練習111
第6章 數據可視化114
6.1 探索性數據分析115
6.1.1 面對新的數據集115
6.1.2 匯總統計量和Anscombe四重線117
6.1.3 可視化工具119
6.2 發展可視化美學119
6.2.1 *大化數據墨水比率120
6.2.2 *小化謊言因子121
6.2.3 *大限度地減少圖表垃圾122
6.2.4 恰當的縮放和標注123
6.2.5 有效使用顏色和陰影124
6.2.6 重復的力量125
6.3 圖表類型125
6.3.1 表格數據127
6.3.2 點狀圖和折線圖128
6.3.3 散點圖131
6.3.4 條形圖和餅圖133
6.3.5 直方圖135
6.3.6 數據地圖137
6.4 出色的可視化139
6.4.1 Marey的火車時刻表139
6.4.2 斯諾的霍亂地圖140
6.4.3 紐約氣象年141
6.5 讀圖141
6.5.1 模糊分布141
6.5.2 過度解釋方差142
6.6 交互式可視化143
6.7 實戰故事:TextMap144
6.8 章節注釋146
6.9 練習146
第7章 數學模型149
7.1 建模哲學149
7.1.1 奧卡姆剃刀原理149
7.1.2 權衡偏差與方差150
7.1.3 Nate Silver會怎么做150
7.2 模型分類152
7.2.1 線性模型與非線性模型152
7.2.2 黑盒與描述性模型152
7.2.3 **原理與數據驅動模型153
7.2.4 隨機模型與確定性模型154
7.2.5 平面模型與分層模型155
7.3 基準模型155
7.3.1 分類的基準模型155
7.3.2 價值預測的基準模型156
7.4 評估模型157
7.4.1 評估分類器158
7.4.2 受試者工作特征曲線161
7.4.3 評估多類系統162
7.4.4 評估價值預測模型164
7.5 評估環境165
7.5.1 數據衛生評估167
7.5.2 放大小型評估集167
7.6 實戰故事:100%準確169
7.7 模擬模型170
7.8 實戰故事:經過計算的賭注170
7.9 章節注釋1
展開全部

大數據分析:理論、方法及應用 作者簡介

史蒂文·S. 斯基納(Steven S.Skiena)博士是石溪大學的杰出教授,研究方向是數據科學、自然語言處理和算法。由于對本科教學工作有杰出貢獻,他曾獲得IEEE計算機科學與工程本科教學獎。他還撰寫了6本書,包括知名的The Algorithm Design Manual、Programming Challenges: The Programming Contest Training Manual。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 丹佛斯变频器-丹佛斯压力开关-变送器-广州市风华机电设备有限公司 | 帽子厂家_帽子工厂_帽子定做_义乌帽厂_帽厂_制帽厂 | 硫化罐_蒸汽硫化罐_大型硫化罐-山东鑫泰鑫智能装备有限公司 | 天空彩票天下彩,天空彩天空彩票免费资料,天空彩票与你同行开奖,天下彩正版资料大全 | 南京技嘉环保科技有限公司-杀菌除臭剂|污水|垃圾|厕所|橡胶厂|化工厂|铸造厂除臭剂 | 楼梯定制_楼梯设计施工厂家_楼梯扶手安装制作-北京凌步楼梯 | 安全光栅|射频导纳物位开关|音叉料位计|雷达液位计|两级跑偏开关|双向拉绳开关-山东卓信机械有限公司 | 升降机-高空作业车租赁-蜘蛛车-曲臂式伸缩臂剪叉式液压升降平台-脚手架-【普雷斯特公司厂家】 | 优宝-汽车润滑脂-轴承润滑脂-高温齿轮润滑油脂厂家 | 阴离子聚丙烯酰胺价格_PAM_高分子聚丙烯酰胺厂家-河南泰航净水材料有限公司 | 厌氧反应器,IC厌氧反应器,厌氧三相分离器-山东创博环保科技有限公司 | 深圳标识制作公司-标识标牌厂家-深圳广告标识制作-玟璟广告-深圳市玟璟广告有限公司 | 医学动画公司-制作3d医学动画视频-医疗医学演示动画制作-医学三维动画制作公司 | 不锈钢水管-不锈钢燃气管-卫生级不锈钢管件-不锈钢食品级水管-广东双兴新材料集团有限公司 | 布袋式除尘器|木工除尘器|螺旋输送机|斗式提升机|刮板输送机|除尘器配件-泊头市德佳环保设备 | 精密交叉滚子轴承厂家,转盘轴承,YRT转台轴承-洛阳千协轴承 | 户外-组合-幼儿园-不锈钢-儿童-滑滑梯-床-玩具-淘气堡-厂家-价格 | 磁力链接搜索神器_BT磁力狗_CILIMAO磁力猫_高效磁力搜索引擎2024 | 影像测量仪_三坐标测量机_一键式二次元_全自动影像测量仪-广东妙机精密科技股份有限公司 | 油漆辅料厂家_阴阳脚线_艺术漆厂家_内外墙涂料施工_乳胶漆专用防霉腻子粉_轻质粉刷石膏-魔法涂涂 | 即用型透析袋,透析袋夹子,药敏纸片,L型涂布棒-上海桥星贸易有限公司 | 塑胶跑道施工-硅pu篮球场施工-塑胶网球场建造-丙烯酸球场材料厂家-奥茵 | 石油/泥浆/不锈钢防腐/砂泵/抽砂泵/砂砾泵/吸砂泵/压滤机泵 - 专业石油环保专用泵厂家 | 【官网】博莱特空压机,永磁变频空压机,螺杆空压机-欧能优 | 北京征地律师,征地拆迁律师,专业拆迁律师,北京拆迁律师,征地纠纷律师,征地诉讼律师,征地拆迁补偿,拆迁律师 - 北京凯诺律师事务所 | 济南网站策划设计_自适应网站制作_H5企业网站搭建_济南外贸网站制作公司_锐尚 | 工业洗衣机_工业洗涤设备_上海力净工业洗衣机厂家-洗涤设备首页 bkzzy在职研究生网 - 在职研究生招生信息咨询平台 | 酸度计_PH计_特斯拉计-西安云仪| 集装箱标准养护室-集装箱移动式养护室-广州璟业试验仪器有限公司 | 大白菜官网,大白菜winpe,大白菜U盘装系统, u盘启动盘制作工具 | 在线浊度仪_悬浮物污泥浓度计_超声波泥位计_污泥界面仪_泥水界面仪-无锡蓝拓仪表科技有限公司 | 高效复合碳源-多核碳源生产厂家-污水处理反硝化菌种一长隆科技库巴鲁 | 深圳标识制作公司-标识标牌厂家-深圳广告标识制作-玟璟广告-深圳市玟璟广告有限公司 | 定坤静电科技静电消除器厂家-除静电设备 | 金环宇|金环宇电线|金环宇电缆|金环宇电线电缆|深圳市金环宇电线电缆有限公司|金环宇电缆集团 | 写方案网_方案策划方案模板下载| 磁粉制动器|张力控制器|气胀轴|伺服纠偏控制器整套厂家--台灵机电官网 | 安徽成考网-安徽成人高考网 | 重庆磨床过滤机,重庆纸带过滤机,机床伸缩钣金,重庆机床钣金护罩-重庆达鸿兴精密机械制造有限公司 | 自恢复保险丝_贴片保险丝_力特保险丝_Littelfuse_可恢复保险丝供应商-秦晋电子 | 代办建筑资质升级-建筑资质延期就找上海国信启航|