中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊

包郵 數據挖掘

出版社:電子工業出版社出版時間:2018-03-01
開本: 32開 頁數: 348
中 圖 價:¥23.0(4.0折) 定價  ¥58.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
溫馨提示:5折以下圖書主要為出版社尾貨,大部分為全新(有塑封/無塑封),個別圖書品相8-9成新、切口
有劃線標記、光盤等附件不全詳細品相說明>>
本類五星書更多>

數據挖掘 版權信息

數據挖掘 本書特色

中國大數據專家委員會劉鵬教授聯合全國上百家高校從事一線教學科研任務的教師,一起編撰高級大數據人才培養從書。本書是叢書之一,其定位是大數據挖掘技術與應用。本書系統地介紹了數據挖掘算法理論與方法、工具和應用,包括經典數據挖掘算法,大數據環境下常用數據挖掘算法的優化,大數據新常態下催生的數據分析方法(如推薦系統、鏈接分析與網頁排序、互聯網信息抽取、日志挖掘與查詢分析)、工具與應用。本書適合作為相關專業本科和研究生教材。高職高專學校也可以選用部分內容開展教學。本書也很適合作為大數據分析研發人員的自學書籍。

數據挖掘 內容簡介



短短幾年間,大數據就以一日千里的發展速度,快速實現了從概念到落地,直接帶
動了相關產業井噴式發展。全球多家研究機構統計數據顯示,大數據產業將迎來發展黃
金期:IDC 預計,大數據和分析市場將從2016 年的1300 億美元增長到2020 年的2030
億美元以上;中國報告大廳發布的大數據行業報告數據也說明,自2017 年起,我國大數據
產業將迎來發展黃金期,未來2~3 年的市場規模增長率將保持在35%左右。
數據采集、數據存儲、數據挖掘、數據分析等大數據技術在越來越多的行業中得到
應用,隨之而來的就是大數據人才問題的凸顯。麥肯錫預測,每年數據科學專業的應屆
畢業生將增加7%,然而僅高質量項目對于專業數據科學家的需求每年就會增加12%,完
全供不應求。根據《人民日報》的報道,未來3~5 年,中國需要180 萬數據人才,但目
前只有約30 萬人,人才缺口達到150 萬之多。
以貴州大學為例,其首屆大數據專業研究生就業率就達到100%,可以說“一搶而空”。
急切的人才需求直接催熱了大數據專業,國家教育部正式設立“數據科學與大數據技術”
本科新專業。目前已經有兩批共計35 所大學獲批,包括北京大學、中南大學、對外經
濟貿易大學、中國人民大學、北京郵電大學、復旦大學等。估計2018 年會有幾百所高
校獲批。
不過,就目前而言,在大數據人才培養和大數據課程建設方面,大部分高校仍然處
于起步階段,需要探索的還有很多。首先,大數據是個新生事物,懂大數據的老師少之總序
短短幾年間,大數據就以一日千里的發展速度,快速實現了從概念到落地,直接帶
動了相關產業井噴式發展。全球多家研究機構統計數據顯示,大數據產業將迎來發展黃
金期:IDC 預計,大數據和分析市場將從2016 年的1300 億美元增長到2020 年的2030
億美元以上;中國報告大廳發布的大數據行業報告數據也說明,自2017 年起,我國大數據
產業將迎來發展黃金期,未來2~3 年的市場規模增長率將保持在35%左右。
數據采集、數據存儲、數據挖掘、數據分析等大數據技術在越來越多的行業中得到
應用,隨之而來的就是大數據人才問題的凸顯。麥肯錫預測,每年數據科學專業的應屆
畢業生將增加7%,然而僅高質量項目對于專業數據科學家的需求每年就會增加12%,完
全供不應求。根據《人民日報》的報道,未來3~5 年,中國需要180 萬數據人才,但目
前只有約30 萬人,人才缺口達到150 萬之多。
以貴州大學為例,其首屆大數據專業研究生就業率就達到100%,可以說“一搶而空”。
急切的人才需求直接催熱了大數據專業,國家教育部正式設立“數據科學與大數據技術”
本科新專業。目前已經有兩批共計35 所大學獲批,包括北京大學、中南大學、對外經
濟貿易大學、中國人民大學、北京郵電大學、復旦大學等。估計2018 年會有幾百所高
校獲批。
不過,就目前而言,在大數據人才培養和大數據課程建設方面,大部分高校仍然處
于起步階段,需要探索的還有很多。首先,大數據是個新生事物,懂大數據的老師少之
又少,院校缺“人”;其次,尚未形成完善的大數據人才培養和課程體系,院校缺“機制”;
再次,大數據實驗需要為每位學生提供集群計算機,院校缺“機器”;*后,院校沒有海
量數據,開展大數據教學科研工作缺“原材料”。
其實,早在網格計算和云計算興起時,我國科技工作者就曾遇到過類似的挑戰,我
有幸參與了這些問題的解決過程。為了解決網格計算問題,我在清華大學讀博期間,于
2001 年創辦了中國網格信息中轉站網站,每天花幾個小時收集和分享有價值的資料給學
術界,此后我也多次籌辦和主持全國性的網格計算學術會議,進行信息傳遞與知識分享。
2002 年,我與其他專家合作的《網格計算》教材也正式面世。
2008 年,當云計算開始萌芽之時,我創辦了中國云計算網站(chinacloud.cn)(在各
大搜索引擎“云計算”關鍵詞中排名*),2010 年出版了《云計算(*版)》、2011
年出版了《云計算(第二版)》、2015 年出版了《云計算(第三版)》,每一版都花費了大
量成本制作并免費分享對應的幾十個教學PPT。目前,這些PPT 的下載總量達到了幾百
萬次之多。同時,《云計算》教材也成為國內高校的*教材,在CNKI 公布的高被引圖
書名單中,對于2010 年以來出版的所有圖書,《云計算(*版)》在自動化和計算機領域
排名全國*。除了資料分享,在2010 年,我也在南京組織了全國高校云計算師資培訓
班,培養了國內*批云計算老師,并通過與華為、中興、360 等知名企業合作,輸出云
計算技術,培養云計算研發人才。這些工作獲得了大家的認可與好評,此后我接連擔任
了工信部云計算研究中心專家、中國云計算專家委員會云存儲組組長等職位。
近幾年,面對日益突出的大數據發展難題,我也正在嘗試使用此前類似的辦法去應
對這些挑戰。為了解決大數據技術資料缺乏和交流不夠通透的問題,我于2013 年創辦了
中國大數據網站(thebigdata.cn),投入大量的人力進行日常維護,該網站目前已經在各
大搜索引擎的“大數據”關鍵詞排名中位居*;為了解決大數據師資匱乏的問題,我
面向全國院校陸續舉辦多期大數據師資培訓班。2016 年末至今,在南京多次舉辦全國高
校/高職/中職大數據免費培訓班,基于《大數據》《大數據實驗手冊》以及云創大數據提
供的大數據實驗平臺,幫助到場老師們跑通了Hadoop、Spark 等多個大數據實驗,使他
們跨過了“從理論到實踐,從知道到用過”的門檻。2017 年5 月,還舉辦了全國千所高
校大數據師資免費講習班,盛況空前。
其中,為了解決大數據實驗難的問題而開發的大數據實驗平臺,正在為越來越多高
校的教學科研帶去方便:2016 年,我帶領云創大數據(www.cstor.cn,股票代碼:835305)
的科研人員,應用Docker 容器技術,成功開發了BDRack 大數據實驗一體機,它打破虛
擬化技術的性能瓶頸,可以為每一位參加實驗的人員虛擬出Hadoop 集群、Spark 集群、
Storm 集群等,自帶實驗所需數據,并準備了詳細的實驗手冊(包含42 個大數據實驗)、
PPT 和實驗過程視頻,可以開展大數據管理、大數據挖掘等各類實驗,并可進行精確營
銷、信用分析等多種實戰演練。目前,大數據實驗平臺已經在鄭州大學、西京學院、鄭
州升達經貿管理學院、鎮江高等職業技術學校等多所院校成功應用,并廣受校方好評。
該平臺也以云服務的方式在線提供(大數據實驗平臺,https://bd.cstor.cn),幫助師生通過
自學,用一個月左右成為大數據動手的高手。
同時,為了解決缺乏權威大數據教材的問題,我所負責的南京大數據研究院,聯合
金陵科技學院、河南大學、云創大數據、中國地震局等多家單位,歷時兩年,編著出版
了適合本科教學的《大數據》《大數據庫》《大數據實驗手冊》等教材。另外,《數據挖掘》
《虛擬化與容器》《大數據可視化》《深度學習》等本科教材也將于近期出版。在大數據教
學中,本科院校的實踐教學應更加系統性,偏向新技術的應用,且對工程實踐能力要求
更高。而高職、高專院校則更偏向于技術性和技能訓練,理論以夠用為主,學生將主要
從事數據清洗和運維方面的工作。基于此,我們還聯合多家高職院校專家準備了《云計
算基礎》《大數據基礎》《數據挖掘基礎》《R 語言》《數據清洗》《大數據系統運維》《大
數據實踐》系列教材,目前也已經陸續進入定稿出版階段。
此外,我們也將繼續在中國大數據(thebigdata.cn)和中國云計算(chinacloud.cn)
等網站免費提供配套PPT 和其他資料。同時, 持續開放大數據實驗平臺
(https://bd.cstor.cn)、免費的物聯網大數據托管平臺萬物云(wanwuyun.com)和環境大數
據免費分享平臺環境云(envicloud.cn),使資源與數據隨手可得,讓大數據學習變得更加
輕松。
在此,特別感謝我的碩士導師謝希仁教授和博士導師李三立院士。謝希仁教授所著
的《計算機網絡》已經更新到第7 版,與時俱進且日臻完美,時時提醒學生要以這樣的
標準來寫書。李三立院士是留蘇博士,為我國計算機事業做出了杰出貢獻,曾任國家攀
登計劃項目首席科學家。他的嚴謹治學帶出了一大批杰出的學生。
本叢書是集體智慧的結晶,在此謹向付出辛勤勞動的各位作者致敬!書中難免會有
不當之處,請讀者不吝賜教。我的郵箱:gloud@126.com,微信公眾號:劉鵬看未來
(lpoutlook)。
劉鵬 教授
于南京大數據研究院
前言
21 世紀初,人類邁入大數據時代,各行各業擁抱大數據,希冀借大數據挖掘與分
析來促進產業升級與變革。因此,大數據人才的需求呈現井噴之勢。
中國云計算專家咨詢委員會秘書長劉鵬教授順勢而為,周密思考,提出高級大數據
人才培養課程體系,并邀請全國上百家高校中從事一線教學科研任務的教師一起,編撰
高級大數據人才培養叢書。本書即該套叢書之一。
本書的定位是大數據挖掘技術與應用。以“讓學習變得輕松”為根本出發點,本書
努力回答:數據挖掘是什么?發展如何?經典的數據挖掘算法有哪些?大數據環境下數
據挖掘有哪些新特點和新延展?如何分析實際問題,如何應用?本書編寫的指導思想有
三:一是理論與應用相呼應。從數據挖掘算法理論與方法、工具和應用兩方面進行闡述,
既注重理論,同時貼近實戰,解行結合,希望學習者既能很快將理論應用于實際領域的
數據分析中,同時也具備厚積薄發的能力;二是基礎與發展一脈相承。大數據新常態下
經典數據挖掘的基本原理仍然適用,不同之處在于,根據現有分布式、并行環境,對原
有算法進行優化。本書擬循序漸進地介紹經典數據挖掘算法,以及大數據環境下數據挖
掘算法的新特點和新延展,有助于學習者全面掌握數據挖掘理論;三是局部與全局整體
聯動。本書屬于高級大數據人才培養叢書系列教材,因此,在本書內容組織上,需要考
慮與叢書其他教材的關系,既緊密聯系又自成一體,共同組成高級大數據人才培養課程
體系。
基于上述指導思想,本書內容分為四部分:一是概念與基礎,見第1 章緒論和第2
章;二是經典的數據挖掘算法,見第3 章分類、第4 章回歸、第5 章聚類和第6 章關聯
規則;三是大數據挖掘技術,其中,第7 章重點介紹了大數據環境下經典數據挖掘算法
的優化與改進,第8 章介紹了推薦系統的理論與方法,第9 章則對鏈接分析與網頁排序、
互聯網信息抽取、日志挖掘與查詢分析等技術進行了介紹;四是常用數據挖掘工具(包),
見附錄。
本書成稿過程中得到叢書主編劉鵬教授和叢書副主編金陵科技學院張燕副院長的大
力支持,在書稿提綱和內容組織上提出了諸多建設性意見。同時,兩輪審稿評審專家對
本書給予了全面指導和幫助,在此一并致謝。
當前,大數據挖掘技術仍處在高速發展的歷史階段,其概念內涵、技術方法、應用
模式還在不斷創新演化之中,由于時間和水平所限,本書還存在缺點和不足,歡迎大家
不吝賜教。

數據挖掘 目錄

第1 章 緒論 ··························································································································1
1.1 數據挖掘基本概念 ··································································································1
1.1.1 數據挖掘的概念 ··························································································1
1.1.2 大數據環境下的數據挖掘 ···········································································2
1.1.3 數據挖掘的特性 ··························································································3
1.1.4 數據挖掘的過程 ··························································································3
1.2 數據挖掘起源及發展歷史 ······················································································4
1.3 數據挖掘常用工具 ··································································································7
1.3.1 商用工具 ······································································································7
1.3.2 開源工具 ······································································································8
1.4 數據挖掘應用場景 ································································································ 10
習題 ································································································································ 12
參考文獻 ························································································································ 13
第2 章 數據預處理與相似性 ····························································································· 14
2.1 數據類型 ··············································································································· 14
2.1.1 屬性與度量 ································································································ 14
2.1.2 數據集的類型 ···························································································· 15
2.2 數據預處理 ··········································································································· 16
2.2.1 數據清理 ···································································································· 16
2.2.2 數據集成 ···································································································· 18
2.2.3 數據規范化 ································································································ 19
2.2.4 數據約簡 ···································································································· 20
2.2.5 數據離散化 ································································································ 22
2.3 數據的相似性 ······································································································· 23
2.3.1 數值屬性的相似性度量 ············································································· 23
2.3.2 標稱屬性的相似性度量 ············································································· 26
2.3.3 組合異種屬性的相似性度量 ····································································· 27
2.3.4 文檔相似性度量 ························································································ 28
2.3.5 離散序列相似性度量 ················································································· 30
習題 ································································································································ 31
參考文獻 ························································································································ 32
第3 章 分類 ························································································································ 33
3.1 分類的基本概念、分類過程及分類器性能的評估 ············································· 33
3.1.1 分類的基本概念 ························································································ 33
3.1.2 分類的過程 ································································································ 33
3.1.3 分類器性能的評估方法 ············································································· 34
3.2 決策樹 ···········································································
展開全部

數據挖掘 作者簡介

1995年在重慶大學獲得學士學位,2003年在中國人民解放軍后勤工程學院獲得碩士學位,2012年在清華大學獲得博士學位,現于中國人民解放軍陸軍勤務學院任教,副教授、碩導。計算機科學與技術學科、后勤信息化學科中青年骨干。主(持)研科研項目35項,其中,主持國家級科研項目1項、軍隊(省部級)6項。發表論文40余篇,SCI收錄期刊論文2篇(1作)、EI收錄論文10篇(1作6篇)。出版專著3本,獲國家發明專利3項。獲教育部科技進步一等獎1項,多次榮獲學院優秀教員榮譽稱號、學院教學研究成果獎和教學質量獎。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 电缆接头_防水接头_电缆防水接头 - 乐清市新豪电气有限公司 | 智能化的检漏仪_气密性测试仪_流量测试仪_流阻阻力测试仪_呼吸管快速检漏仪_连接器防水测试仪_车载镜头测试仪_奥图自动化科技 | 道达尔润滑油-食品级润滑油-道达尔导热油-合成导热油,深圳道达尔代理商合-深圳浩方正大官网 | 电动葫芦|手拉葫芦|环链电动葫芦|微型电动葫芦-北京市凌鹰起重机械有限公司 | 除甲醛公司-甲醛检测治理-杭州创绿家环保科技有限公司-室内空气净化十大品牌 | TPU薄膜_TPU薄膜生产厂家_TPU热熔胶膜厂家定制_鑫亘环保科技(深圳)有限公司 | 水稻烘干机,小麦烘干机,大豆烘干机,玉米烘干机,粮食烘干机_巩义市锦华粮食烘干机械制造有限公司 水环真空泵厂家,2bv真空泵,2be真空泵-淄博真空设备厂 | 多功能干燥机,过滤洗涤干燥三合一设备-无锡市张华医药设备有限公司 | 布袋式除尘器|木工除尘器|螺旋输送机|斗式提升机|刮板输送机|除尘器配件-泊头市德佳环保设备 | 广州各区危化证办理_危险化学品经营许可证代办 | 宝元数控系统|对刀仪厂家|东莞机器人控制系统|东莞安川伺服-【鑫天驰智能科技】 | 英思科GTD-3000EX(美国英思科气体检测仪MX4MX6)百科-北京嘉华众信科技有限公司 | 电子巡更系统-巡检管理系统-智能巡检【金万码】 | 湖南印刷厂|长沙印刷公司|画册印刷|挂历印刷|台历印刷|杂志印刷-乐成印刷 | 广州展台特装搭建商|特装展位设计搭建|展会特装搭建|特装展台制作设计|展览特装公司 | 喷码机,激光喷码打码机,鸡蛋打码机,手持打码机,自动喷码机,一物一码防伪溯源-恒欣瑞达有限公司 | 真空乳化机-灌装封尾机-首页-温州精灌| 方源木业官网-四川木门-全国木门专业品牌 | 专业音响设备_舞台音响设备_会议音响工程-首选深圳一禾科技 | 通辽信息港 - 免费发布房产、招聘、求职、二手、商铺等信息 www.tlxxg.net | 超声波清洗机_细胞破碎仪_实验室超声仪器_恒温水浴-广东洁盟深那仪器 | 金环宇|金环宇电线|金环宇电缆|金环宇电线电缆|深圳市金环宇电线电缆有限公司|金环宇电缆集团 | 颗粒机,颗粒机组,木屑颗粒机-济南劲能机械有限公司 | 喷漆房_废气处理设备-湖北天地鑫环保设备有限公司 | 电机保护器-电动机综合保护器-上海硕吉电器有限公司 | 中矗模型-深圳中矗模型设计有限公司 | 消泡剂-水处理消泡剂-涂料消泡剂-切削液消泡剂价格-东莞德丰消泡剂厂家 | 退火炉,燃气退火炉,燃气热处理炉生产厂家-丹阳市丰泰工业炉有限公司 | 东莞猎头公司_深圳猎头公司_广州猎头公司-广东万诚猎头提供企业中高端人才招聘服务 | 防火门|抗爆门|超大门|医疗门|隔声门-上海加汇门业生产厂家 | 环氧树脂地坪漆_济宁市新天地漆业有限公司 | 微量水分测定仪_厂家_卡尔费休微量水分测定仪-淄博库仑 | 软瓷_柔性面砖_软瓷砖_柔性石材_MCM软瓷厂家_湖北博悦佳软瓷 | 二次元影像仪|二次元测量仪|拉力机|全自动影像测量仪厂家_苏州牧象仪器 | 磁力加热搅拌器-多工位|大功率|数显恒温磁力搅拌器-司乐仪器官网 | 东莞精密模具加工,精密连接器模具零件,自動機零件,冶工具加工-益久精密 | 线粒体膜电位荧光探针-细胞膜-标记二抗-上海复申生物科技有限公司 | 加中寰球移民官网-美国移民公司,移民机构,移民中介,移民咨询,投资移民 | 智能家居全屋智能系统多少钱一套-小米全套价格、装修方案 | 外贮压-柜式-悬挂式-七氟丙烷-灭火器-灭火系统-药剂-价格-厂家-IG541-混合气体-贮压-非贮压-超细干粉-自动-灭火装置-气体灭火设备-探火管灭火厂家-东莞汇建消防科技有限公司 | 便携式高压氧舱-微压氧舱-核生化洗消系统-公众洗消站-洗消帐篷-北京利盟救援 |