中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >>
數據科學與工程導論

包郵 數據科學與工程導論

出版社:華東師范大學出版社出版時間:2021-01-01
開本: 26cm 頁數: 505頁
本類榜單:教材銷量榜
中 圖 價:¥50.7(7.3折) 定價  ¥69.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

數據科學與工程導論 版權信息

數據科學與工程導論 本書特色

本書圍繞數據全生命周期介紹了數據科學與工程的基本理論,具體包括七部分內容:部分緒論;第二部分大規(guī)模數據的采集、加工、管理和數據工程;第三部分數據可視化;第四部分數據分析;第五部分數據應用;第六部分數據科學倫理;第七部分數據科學的不錯實現(xiàn)。

數據科學與工程導論 內容簡介

本書分為四部分, 數據科學與工程概述、數據與計算的基礎設施、數據分析的原理與方法、數據應用與社會問題。內容包括: 數據思維與問題求解 ; 數據的模型與結構等。

數據科學與工程導論 目錄

**部分 數據科學與工程概述
第1章
緒論
1.1 信息文明與數據簡史
1.2 數據科學與工程的基本內涵
1.3 第四范式:數據密集型科學
1.4 數據科學與工程的應用
1.5 實踐:以Git與Python為中心
1.6 本章小結
1.7 習題與實踐
第2章
數據思維與問題求解
2.1 問題求解與思維方式
2.2 計算思維與數據思維
2.3 計算思維與數據思維實例
2.4 實踐:Python問題求解
2.5 本章小結
2.6 習題與實踐

第二部分 數據與計算的基礎設施
第3章
數據的模型與結構
3.1 比特與數據
3.2 進制與數據表達
3.3 數據的編碼與存儲
3.4 數據的模型
3.5 數據的結構
3.6 實踐:Python數據結構
3.7 本章小結
3.8 習題與實踐
第4章
數據的計算與程序表達
4.1 數據的計算
4.2 算法分析
4.3 算法的實例
4.4 計算機編程語言
4.5 實踐:Python算法
4.6 本章小結
4.7 習題與實踐
第5章
計算基礎設施
5.1 數據處理的通用機器
5.2 程序執(zhí)行過程
5.3 計算機系統(tǒng)結構
5.4 基礎設施軟件
5.5 云計算與數據中心
5.6 實踐:基礎設施數據采集與分析
5.7 本章小結
5.8 習題與實踐
第6章
數據的全生命周期管理
6.1 數據采集
6.2 數據存儲
6.3 數據管理
6.4 數據計算
6.5 數據分析
6.6 數據展示
6.7 實踐:Python網絡爬蟲
6.8 本章小結
6.9 習題與實踐
第7章
數據庫系統(tǒng)
7.1 數據庫的起源與發(fā)展
7.2 關系數據庫
7.3 數據倉庫與OLAP
7.4 SQL語言
7.5 實踐:SQL數據處理與分析
7.6 本章小結
7.7 習題與實踐
第8章
大數據系統(tǒng)
8.1 大數據的基本概念
8.2 Hadoop和Spark生態(tài)
8.3 SQL與Hadoop的組合
8.4 大數據系統(tǒng)的發(fā)展與未來
8.5 實踐:Hadoop與Spark大數據處理
8.6 本章小結
8.7 習題與實踐

第三部分 數據分析的原理與方法
第9章
數據科學過程
9.1 數據科學過程基礎
9.2 數據科學工作流
9.3 實踐:KNIME數據科學工作流
9.4 本章小結
9.5 習題與實踐
第10章
統(tǒng)計分析的原理
10.1 數據科學的數學基礎
10.2 概率與統(tǒng)計基礎
10.3 統(tǒng)計建模:線性回歸模型
10.4 數據分析的工具
10.5 實踐:Python統(tǒng)計分析
10.6 本章小結
10.7 習題與實踐
第11章
機器學習方法
11.1 機器學習發(fā)展歷史
11.2 機器學習方法
11.3 機器學習*新發(fā)展
11.4 經典機器學習算法
11.5 實踐:Python機器學習
11.6 本章小結
11.7 習題與實踐
第12章
深度學習
12.1 深度學習介紹
12.2 深度學習價值
12.3 誤差反向傳播算法
12.4 卷積神經網絡
12.5 深度學習工具
12.6 實踐:Python深度學習——手寫漢字識別
12.7 本章小結
12.8 習題與實踐
第13章
數據挖掘基礎
13.1 初識數據挖掘
13.2 數據挖掘技術
13.3 典型數據挖掘算法
13.4 實踐:Python圖像分類
13.5 本章小結
13.6 習題與實踐
第14章
非結構化數據挖掘
14.1 自然語言處理
14.2 語音信號處理
14.3 圖像處理與理解
14.4 實踐:Python文本數據挖掘
14.5 本章小結
14.6 習題與實踐

第四部分 數據應用與社會問題
第15章
數據綜合應用
15.1 搜索引擎
15.2 智能運維
15.3 開源數字年報
15.4 本章小結
15.5 習題與實踐
第16章
數據道德與職業(yè)行為準則
16.1 開放的世界
16.2 數據科學與工程職業(yè)規(guī)劃
16.3 數據隱私與社會問題
16.4 數據與人工智能倫理
16.5 本章小結
16.6 習題與實踐

文獻閱讀
參考文獻
附錄

算法 程序列表
第1章 緒論 3
程序1.1 **個Python數據科學程序 36

第2章 數據思維與問題求解 39
程序2.1 遞歸加法 52
程序2.2 *小值_循環(huán) 52
程序2.3 *小值_遞歸 53
程序2.4 *小值_分治 54
程序2.5 驗證帕斯卡的分析 56
程序2.6 估計π值 58
程序2.7 開平方1 “笨辦法” 62
程序2.8 開平方2 二分法 63
程序2.9 開平方3 牛頓法 64
程序2.10 開平方4 蒙特卡羅法 66

第3章 數據的模型與結構 71
程序3.1 變量的賦值 97
程序3.2 棧的實現(xiàn) 97
程序3.3 簡單樹的實現(xiàn) 99
程序3.4 用列表創(chuàng)建簡單樹 99
程序3.5 二叉樹類的定義 99
程序3.6 二叉樹中插入左子節(jié)點 100
程序3.7 二叉樹中插入右子節(jié)點 100
程序3.8 獲取和設置根值以及獲得左右子樹 100

第4章 數據的計算與程序表達 103
算法4.1 函數search for X 112
程序4.2 交換變量a和b的值 117
算法4.3 冒泡排序 118
算法4.4 漢諾塔問題的解 120
算法4.5 樹排序 124
程序4.6 冒泡排序 130
程序4.7 選擇排序 132
程序4.8 插入排序 133
程序4.9 快速排序 135
程序4.10 希爾排序 137

第5章 計算基礎設施 138
程序5.1 替換函數1 167
程序5.2 替換函數2 167
程序5.3 替換函數3 167
程序5.4 替換函數4 167
程序5.5 程序性能測試 168

第6章 數據的全生命周期管理 171
程序6.1 散點圖 191
程序6.2 網絡爬蟲 198
程序6.3 繪制散點圖 200
程序6.4 繪制正弦、余弦曲線 200
程序6.5 繪制等高線圖 201

第7章 數據庫系統(tǒng) 204
程序7.1 查詢客戶總消費額 212
程序7.2 數據庫事務 213
程序7.3 創(chuàng)建表 228
程序7.4 SQL查詢1 228
程序7.5 SQL查詢2 229
程序7.6 SQL查詢3 229
程序7.7 SQL查詢4 230
程序7.8 SQL查詢5 230
程序7.9 SQL查詢6 231
程序7.10 SQL分析1 231
程序7.11 SQL分析2 231
程序7.12 SQL分析3 232
程序7.13 SQL分析4 232
程序7.14 SQL分析5 232

第8章 大數據系統(tǒng) 235
程序8.1 map代碼 258
程序8.2 reduce代碼 258
程序8.3 用Spark進行WordCount 261

第10章 統(tǒng)計分析的原理 296
程序10.1 文本詞頻統(tǒng)計 323
程序10.2 線性回歸模型 325

第11章 機器學習方法 329
程序11.1 損失函數 350
程序11.2 梯度計算函數 350
程序11.3 梯度下降算法 351

第12章 深度學習 359
程序12.1 基于VGG模型的手寫漢字識別模型 384

第13章 數據挖掘基礎 387
程序13.1 KNN算法模型 413
程序13.2 訓練KNN 414

第14章 非結構化數據挖掘 417
程序14.1 詞云制作 433
程序14.2 文本分類實踐 434

第15章 數據綜合應用 445
程序15.1 使用倒排索引的檢索處理 455
程序15.2 基于文檔和查詢關聯(lián)度的檢索 456
程序15.3 基于查詢單詞的文檔和查詢關聯(lián)度的檢索 457
程序15.4 基于排序的索引構建 458
程序15.5 基于合并的索引構建 459
展開全部

數據科學與工程導論 節(jié)選

數據科學與工程核心課程的系列教材終于要面世了,這是一件鼓舞人心的事。作為華東師范大學數據學院的發(fā)起者和見證人,核心課程和系列教材一直是我心心念念的事情。值此系列教材出版發(fā)行之際,我很高興能被邀請寫幾句話,做個回顧,分享一些感悟,也展望一下未來。 借著大數據熱的東風,依托何積豐院士在2007年倡導成立的華東師范大學海量計算研究所,2012年6月在時任SAP公司CTO史維學博士(Dr. Vishal Sikka)的支持下,我們成立了華東師范大學云計算與大數據研究中心。2013年9月,學校發(fā)起成立作為二級獨立實體的數據科學與工程研究院,開始在軟件工程一級學科下自設數據科學與工程二級學科,開展博士研究生和碩士研究生的培養(yǎng)工作。在進行研究生培養(yǎng)的探索過程中,我們深切感受到計算機類的本科生人才培養(yǎng)需要反思和改革。因此,到了2016年9月,研究院改制成數據科學與工程學院,隨后就開始招收數據科學與工程專業(yè)的本科生,**屆本科生已于2020年畢業(yè),這就是我們學院和專業(yè)的簡單歷史。經過這么幾年的實踐和思考,我們越發(fā)堅信當年對“數據科學與工程”這一名稱的選擇,“數據學院”和“數據專業(yè)”已經得到越來越多的認可,學院的師生也逐漸接受“數據人”這一稱呼。 這里我想分享以下幾方面的感悟:為什么要辦數據專業(yè)?怎么辦數據專業(yè)?教材為什么很重要?對人才培養(yǎng)有什么貢獻? 為什么要辦數據專業(yè)?數據是新能源,這是大家耳熟能詳的一句話。說到能源,我們首先想到的是石油,所以大家就習慣把數據比喻成石油。但是,在我們看來,“新能源”對應的英文應該是“New Power”!癉ata is Power”,這是我們的基本信念,也是我們要辦數據學院的根本動機。數據是人類文明史上的第三個重要的Power,之前的兩個Power是蒸汽能(Steam Power)和電能(Electric Power),它們分別引發(fā)了**次和第二次工業(yè)革命。如果說蒸汽能和電能造就了從西方世界開始的兩百多年的工業(yè)文明,數據能(Data Power)將把人類帶入數字文明時代。數據是數字經濟發(fā)展的重要生產要素,這個生產要素不同于土地、勞動力,也不同于資本、技術。如果要給數據找一個恰當的比擬物,也許只有19世紀末偉大的發(fā)明家尼古拉·特斯拉發(fā)明的交流電。數據是新時代的交流電,就像20世紀,交流電給世界帶來的深刻變化一樣,隨著人們對數據能(Data Power)認識的提高,我們將進入一個“未來已來,一切重構”的時代。數據學院就像一百多年前的電力學院或電氣學院。 怎么辦數據專業(yè)?我們數據學院脫胎于軟件工程學院,在此以前還有計算機科學與工程學院,數據相關的研究和偏向管理的圖書情報方向的信息系統(tǒng)學科及專業(yè)也密切相關,應用數學、概率統(tǒng)計更是數據分析和處理的理論基礎,不可或缺。到底什么樣的專業(yè)才算是數據專業(yè)?起初的時候,這對我們來說基本上可以說是一個“靈魂拷問”。為此,我們發(fā)起成立了由國內十五所高校三十多位知名教授組成的“高校數據科學與工程專業(yè)建設協(xié)作組”。 并且以協(xié)作組成員為班底,成立了數據科學與工程系列教材編委會,除了協(xié)作組成員,還邀請了多位有豐富教材編寫經驗的華東師范大學教師加入編委會,共同策劃教材的內容安排。 我們相信,有了先進的理念,再加上集體的力量,數據專業(yè)建設的探索之路就能走通。截至2020年11月,協(xié)作組已經召開了四次研討會,確定了被稱為CST的專業(yè)建設路線圖,C代表Curriculum(培養(yǎng)計劃),S代表Syllabus(課程大綱),T代表Textbook(教材建設)。在得知我們的工作后,ACM/IEEE計算機工程學科規(guī)范主席約翰·因帕利亞佐(John Impagliazzo)教授邀請我們參與了ACM/IEEE數據科學學科規(guī)范的制定。協(xié)作組經過討論達成共識:專業(yè)課程分為基礎課、核心課、方向課三類,核心課是體現(xiàn)專業(yè)區(qū)分度的一組課程。與數據專業(yè)(DSE)*相近的專業(yè)就是計算機科學與工程(CSE)及軟件工程(SE)兩個專業(yè),我們確定的**批DSE區(qū)別于CSE和SE 的8門核心課程是:數據科學與工程導論、數據科學與工程數學基礎、數據科學與工程算法基礎、應用統(tǒng)計與機器學習、當代數據管理系統(tǒng)、當代人工智能、分布式計算系統(tǒng)、云計算系統(tǒng)。隨后我們又確定兩門課納入這個系列,分別是:區(qū)塊鏈導論——原理、技術與應用,數據中臺初階教程。數據專業(yè)作為一個新專業(yè),三類課程的邊界還不清晰,我們將關注重點放在核心課程上面,核心課有遺漏的知識點可以納入基礎課或方向課。這樣可以保證知識體系的完整性,簡單起步,快速迭代。隨著實踐和認識的深入,逐漸明晰三類課程的邊界,形成完善的培養(yǎng)計劃。 教材為什么很重要?建設好一個專業(yè),確定培養(yǎng)計劃和課程體系固然很重要,但落實在根本上是教材。一套好的教材是建成一個好的專業(yè)的前提。放眼看去,無論是國內還是國外,無論是具體某個高校還是國家區(qū)域層面,這都是不爭的事實,即好的專業(yè)都有成體系的好的教材。當然,現(xiàn)在的教材已經不僅僅指單純的一本教科書,還有深層次的內容,比如說具體的教學內容和教學方式。我們都知道,教材是知識的結晶,是站到巨人肩膀上的臺階。在自然科學領域,確實如此,一百年前我們民族的仁人志士呼喚“賽先生”,在中華大地上科學的傳播帶來了翻天覆地的變化。在更廣泛的領域,教材也還是技術、工藝和文化的傳承,是產業(yè)發(fā)展的助推器。拿信息技術來舉例,技術的源頭和產業(yè)的發(fā)祥地都在美國和歐洲,像IBM、Lucent、Oracle等跨國企業(yè)在我國商業(yè)上取得的巨大成功無一不與他們重視教材開發(fā)密切相關。試想一下,我們的學生在課堂上學的都是他們研究和研發(fā)的東西,等走上工作崗位,自然會對熟悉的技術和系統(tǒng)有親近感,這應該是產業(yè)或產品生態(tài)*重要的一個環(huán)節(jié)。21世紀以來,隨著互聯(lián)網的蓬勃發(fā)展,人們已經深刻認識到,互聯(lián)網改變世界。在人類的文明史上,沒有任何一項科研成果像互聯(lián)網這樣深刻地改變人、改變世界。互聯(lián)網之所以能改變世界,是因為它真正發(fā)揮了數據的威力;ヂ(lián)網實現(xiàn)了信息技術發(fā)展從“以計算為中心”到“以數據為中心”的路徑轉變。用“昔日王謝堂前燕,飛入尋常百姓家”來形容很多我們以前甚至當前教材上的一些內容,可以說毫不為過。以互聯(lián)網為代表的新型產業(yè)的發(fā)展,極大地推動了技術的進步,我們已經到了可以編寫自己的教材,形成自己的技術體系和科學理論體系的時候了。我們是現(xiàn)代科學的后來者,已經習慣了從科學到技術再到應用的路徑,現(xiàn)在有了成功的應用,企業(yè)也發(fā)展出了領先的技術,學界可以在此基礎上發(fā)展出技術體系和科學理論體系,應用、技術和科學的聯(lián)動才是真正的創(chuàng)新之路。 對人才培養(yǎng)有什么貢獻?在信息技術領域,迄今為止我們更多地是參考或沿襲了西方發(fā)達國家的培養(yǎng)計劃和教材體系。在改革開放以來的四十年,這種“拿來主義”的做法很有效,培養(yǎng)了大量的人才,推動了我國的社會經濟發(fā)展。但總的來說,我們的高校在這一領域更像是在培養(yǎng)“駕駛員”,培養(yǎng)開車的人,現(xiàn)在到了需要我們來培養(yǎng)自己的造車人的時候了。技術發(fā)展趨勢如此,國際形勢也對我們提出了這樣的要求。我們處在一個大變局的時代,世界充滿不確定性,開放和創(chuàng)新是應對不確定性的不二之選。創(chuàng)新成為人才培養(yǎng)的**性原理,更新觀念、變革教育、卓越育人是我們華東師范大學新時期人才培養(yǎng)的基本理念。人才培養(yǎng)是大學的**要務,科學研究、社會服務和文化傳承是大學的另外三大職能,大學通過這三大職能的實現(xiàn)可以更好地服務于人才培養(yǎng)。人工智能時代*稀缺的是想象力,想象力是比知識更重要的東西。如何在傳播知識、傳承文化的同時,保護和激發(fā)學生的想象力,這也許是當前教育需要關注的。激發(fā)想象力,培養(yǎng)創(chuàng)新能力,這是數據專業(yè)核心課程系列教材建設的指導思想,我們愿意為之付出,久久為功地建設這套數據專業(yè)核心課程系列教材就是我們踐行以上認識和理解的一個具體行動。 *后,要特別表示感謝。感謝華東師范大學出版社和高等教育出版社的支持和鼓勵,感謝數據科學與工程專業(yè)建設協(xié)助組的各位老師的通力協(xié)作和辛勤勞動,也要感謝數據學院師生的信任和付出。心有所信,方能行遠;因為相信,所以看見。希望作為探路者而付出的所有艱辛能夠成為我們學術和事業(yè)生涯中的一筆重要財富。 “The best way to predict the future is to invent it.”—— Alan Kay “Imagination is more important than knowledge. For knowledge is limited to all we now know and understand, while imagination embraces the entire world, and all there ever will be to know and understand.” ——Albert Einstein 2020年11月

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 东莞ERP软件_广州云ERP_中山ERP_台湾工厂erp系统-广东顺景软件科技有限公司 | 冷却塔降噪隔音_冷却塔噪声治理_冷却塔噪音处理厂家-广东康明冷却塔降噪厂家 | 网站建设-高端品牌网站设计制作一站式定制_杭州APP/微信小程序开发运营-鼎易科技 | 安徽净化工程设计_无尘净化车间工程_合肥净化实验室_安徽创世环境科技有限公司 | 气动机械手-搬运机械手-气动助力机械手-山东精瑞自动化设备有限公司 | 高柔性拖链电缆-聚氨酯卷筒电缆-柔性屏蔽电缆厂家-玖泰电缆 | 济南网站策划设计_自适应网站制作_H5企业网站搭建_济南外贸网站制作公司_锐尚 | 深圳办公室装修,办公楼/写字楼装修设计,一级资质 - ADD写艺 | 山东钢衬塑罐_管道_反应釜厂家-淄博富邦滚塑防腐设备科技有限公司 | 硅胶管挤出机厂家_硅胶挤出机生产线_硅胶条挤出机_臣泽智能装备 贵州科比特-防雷公司厂家提供贵州防雷工程,防雷检测,防雷接地,防雷设备价格,防雷产品报价服务-贵州防雷检测公司 | 生产自动包装秤_颗粒包装秤_肥料包装秤等包装机械-郑州鑫晟重工科技有限公司 | 广州活动策划公司-15+年专业大型公关活动策划执行管理经验-睿阳广告 | 衬塑管道_衬四氟管道厂家-淄博恒固化工设备有限公司 | 北京公寓出租网-北京酒店式公寓出租平台| 澳门精准正版免费大全,2025新澳门全年免费,新澳天天开奖免费资料大全最新,新澳2025今晚开奖资料,新澳马今天最快最新图库-首页-东莞市傲马网络科技有限公司 | 体视显微镜_荧光生物显微镜_显微镜报价-微仪光电生命科学显微镜有限公司 | 无水硫酸铝,硫酸铝厂家-淄博双赢新材料科技有限公司 | 青岛侦探_青岛侦探事务所_青岛劝退小三_青岛调查出轨取证公司_青岛婚外情取证-青岛探真调查事务所 | 小型铜米机-干式铜米机-杂线全自动铜米机-河南鑫世昌机械制造有限公司 | 对辊破碎机_四辊破碎机_双齿辊破碎机_华盛铭重工 | 阁楼货架_阁楼平台_仓库仓储设备_重型货架_广州金铁牛货架厂 | 购买舔盐、舔砖、矿物质盐压块机,鱼饵、鱼饲料压块机--请到杜甫机械 | 新疆系统集成_新疆系统集成公司_系统集成项目-新疆利成科技 | 福州时代广告制作装饰有限公司-福州广告公司广告牌制作,福州展厅文化墙广告设计, | 能耗监测系统-节能监测系统-能源管理系统-三水智能化 | 苏州防水公司_厂房屋面外墙防水_地下室卫生间防水堵漏-苏州伊诺尔防水工程有限公司 | 阴离子_阳离子聚丙烯酰胺厂家_聚合氯化铝价格_水处理絮凝剂_巩义市江源净水材料有限公司 | 承插管件_不锈钢承插管件_锻钢高压管件-温州科正阀门管件有限公司 | 汽液过滤网厂家_安平县银锐丝网有限公司 | 消泡剂-水处理消泡剂-涂料消泡剂-切削液消泡剂价格-东莞德丰消泡剂厂家 | 上海深蓝_缠绕机_缠膜机-上海深蓝机械装备有限公司 | 杰福伦_磁致伸缩位移传感器_线性位移传感器-意大利GEFRAN杰福伦-河南赉威液压科技有限公司 | 汽车水泵_汽车水泵厂家-瑞安市骏迪汽车配件有限公司 | 礼仪庆典公司,礼仪策划公司,庆典公司,演出公司,演艺公司,年会酒会,生日寿宴,动工仪式,开工仪式,奠基典礼,商务会议,竣工落成,乔迁揭牌,签约启动-东莞市开门红文化传媒有限公司 | 气密性检测仪_气密性检测设备_防水测试仪_密封测试仪-岳信仪器 | 铝合金风口-玻璃钢轴流风机-玻璃钢屋顶风机-德州东润空调设备有限公司 | 气动调节阀,电动调节阀,自力式压力调节阀,切断阀「厂家」-浙江利沃夫自控阀门 | 数年网路-免费在线工具您的在线工具箱-shuyear.com | 赛默飞Thermo veritiproPCR仪|ProFlex3 x 32PCR系统|Countess3细胞计数仪|371|3111二氧化碳培养箱|Mirco17R|Mirco21R离心机|仟诺生物 | 淋巴细胞分离液_口腔医疗器材-精欣华医疗器械(无锡)有限公司 | 长沙一级消防工程公司_智能化弱电_机电安装_亮化工程专业施工承包_湖南公共安全工程有限公司 |