包郵 數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)叢書數(shù)據(jù)科學(xué)概論(數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)叢書)
-
>
闖進(jìn)數(shù)學(xué)世界――探秘歷史名題
-
>
中醫(yī)基礎(chǔ)理論
-
>
當(dāng)代中國政府與政治(新編21世紀(jì)公共管理系列教材)
-
>
高校軍事課教程
-
>
思想道德與法治(2021年版)
-
>
毛澤東思想和中國特色社會主義理論體系概論(2021年版)
-
>
中醫(yī)內(nèi)科學(xué)·全國中醫(yī)藥行業(yè)高等教育“十四五”規(guī)劃教材
數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)叢書數(shù)據(jù)科學(xué)概論(數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)叢書) 版權(quán)信息
- ISBN:9787300290607
- 條形碼:9787300290607 ; 978-7-300-29060-7
- 裝幀:一般膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>>
數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)叢書數(shù)據(jù)科學(xué)概論(數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)叢書) 內(nèi)容簡介
作為問題導(dǎo)向、數(shù)據(jù)驅(qū)動的交叉學(xué)科,數(shù)據(jù)科學(xué)要求研究者具備扎實(shí)的知識儲備、高效的編程能力以及廣闊的研究視野。本書嘗試以概論的形式對數(shù)據(jù)科學(xué)的緣起、內(nèi)涵、技術(shù)、工具、原則、方法、平臺、產(chǎn)品、應(yīng)用等展開討論,幫助讀者建立完整的知識體系與專業(yè)邏輯。全書劃分為四個部分:部分是緒論,鳥瞰數(shù)據(jù)科學(xué)的概念、歷史與應(yīng)用;第二部分是基礎(chǔ)技能,涵蓋編程工具、數(shù)學(xué)基礎(chǔ)與統(tǒng)計(jì)原則;第三部分是分析方法,遵從從探索性到驗(yàn)證性的數(shù)據(jù)分析思路,闡釋數(shù)據(jù)可視化方法,講解面向結(jié)構(gòu)化數(shù)據(jù)的機(jī)器學(xué)習(xí)與人工智能模型,并討論非結(jié)構(gòu)化數(shù)據(jù)的分析技術(shù);第四部分是數(shù)據(jù)應(yīng)用,從業(yè)界視角介紹數(shù)據(jù)庫、大數(shù)據(jù)平臺、可重復(fù)研究的理念與實(shí)踐,并以互聯(lián)網(wǎng)、零售、金融、醫(yī)療健康四個行業(yè)為例展開實(shí)戰(zhàn)討論。
數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)叢書數(shù)據(jù)科學(xué)概論(數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)叢書) 目錄
1.1數(shù)據(jù)科學(xué)的概念
1.1.1數(shù)據(jù)科學(xué)的研究對象
1.1.2常見的數(shù)據(jù)科學(xué)方法
1.2數(shù)據(jù)科學(xué)的發(fā)展變遷
1.2.1數(shù)據(jù)科學(xué)的前身:統(tǒng)計(jì)學(xué)
1.2.2當(dāng)代統(tǒng)計(jì)學(xué):數(shù)據(jù)科學(xué)
1.3數(shù)據(jù)科學(xué)的應(yīng)用領(lǐng)域
1.3.1互聯(lián)網(wǎng)行業(yè)
1.3.2零售行業(yè)
1.3.3金融行業(yè)
1.3.4醫(yī)療健康行業(yè)
第 2章數(shù)據(jù)科學(xué)的編程工具
2.1 R簡介
2.1.1安裝和設(shè)置
2.1.2基礎(chǔ)操作
2.1.3數(shù)據(jù)結(jié)構(gòu)
2.1.4基礎(chǔ)語法
2.2 Python和數(shù)據(jù)科學(xué)
2.2.1安裝和使用
2.2.2數(shù)據(jù)結(jié)構(gòu)
2.2.3基礎(chǔ)語法
2.3 Julia簡介
2.3.1安裝和使用
2.3.2編程基礎(chǔ)
第 3章數(shù)據(jù)科學(xué)的數(shù)學(xué)基礎(chǔ)
3.1線性代數(shù)
3.1.1向量基礎(chǔ)
3.1.2矩陣運(yùn)算
3.2概率論和數(shù)理統(tǒng)計(jì)
3.2.1隨機(jī)變量和分布
3.2.2數(shù)理統(tǒng)計(jì)簡介
3.3*優(yōu)化方法
3.3.1非線性規(guī)劃
3.3.2線性規(guī)劃
第 4章數(shù)據(jù)科學(xué)的統(tǒng)計(jì)原則
4.1可重復(fù)原則
4.1.1數(shù)據(jù)的擾動
4.1.2模型的擾動
4.2可預(yù)測原則
4.2.1可預(yù)測性
4.2.2交叉驗(yàn)證
4.3可計(jì)算原則
4.3.1大數(shù)據(jù)時代的數(shù)據(jù)特征
4.3.2大規(guī)模數(shù)據(jù)的處理方法
4.3.3高維 /超高維數(shù)據(jù)的處理方法
第 5章數(shù)據(jù)可視化
5.1基礎(chǔ)統(tǒng)計(jì)圖形
5.1.1圖形設(shè)備
5.1.2基礎(chǔ)作圖
5.1.3 ggplot繪圖語言
5.2可視化與數(shù)據(jù)分析
5.2.1單變量的分布
5.2.2兩變量的關(guān)系
5.2.3多變量的關(guān)系
5.3現(xiàn)代數(shù)據(jù)可視化方法
5.3.1動態(tài)統(tǒng)計(jì)圖形
5.3.2交互式工具
第 6章數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)
6.1從海量數(shù)據(jù)到大數(shù)據(jù)
6.1.1海量數(shù)據(jù)與數(shù)據(jù)挖掘
6.1.2大數(shù)據(jù)與機(jī)器學(xué)習(xí)
6.2無監(jiān)督學(xué)習(xí)
6.2.1主成分分析
6.2.2聚類分析
6.3有監(jiān)督學(xué)習(xí)
6.3.1回歸分析
6.3.2分類問題和分類性能評估
6.3.3常用分類模型
第 7章人工智能
7.1人工智能簡史
7.1.1人工智能的發(fā)展歷史
7.1.2從神經(jīng)網(wǎng)絡(luò)到深度學(xué)習(xí)
7.2神經(jīng)網(wǎng)絡(luò)簡介
7.2.1神經(jīng)網(wǎng)絡(luò)模型
7.2.2感知機(jī)的學(xué)習(xí)
7.2.3 BP算法
7.3深度學(xué)習(xí)基礎(chǔ)
7.3.1常見深度學(xué)習(xí)框架
7.3.2 MXNet簡介
7.3.3深度學(xué)習(xí)實(shí)戰(zhàn)
第 8章非結(jié)構(gòu)化數(shù)據(jù)分析
8.1圖像分析
8.1.1圖像處理基礎(chǔ)
8.1.2卷積神經(jīng)網(wǎng)絡(luò)
8.1.3圖像分類示例
8.2文本分析
8.2.1文本數(shù)據(jù)的處理
8.2.2文本分類示例
8.2.3句法分析
8.3音頻分析
8.3.1音頻數(shù)據(jù)的處理
8.3.2音頻特征的提取
第 9章數(shù)據(jù)庫和數(shù)據(jù)倉庫
9.1數(shù)據(jù)結(jié)構(gòu)簡介
9.1.1數(shù)據(jù)的測量尺度
9.1.2數(shù)據(jù)的基礎(chǔ)類型
9.1.3數(shù)據(jù)的邏輯結(jié)構(gòu)
9.2數(shù)據(jù)庫和 SQL
9.2.1數(shù)據(jù)庫基礎(chǔ)介紹
9.2.2常見的數(shù)據(jù)庫產(chǎn)品
9.2.3 SQL語句簡介
9.3數(shù)據(jù)倉庫和商業(yè)智能
9.3.1數(shù)據(jù)倉庫基礎(chǔ)介紹
9.3.2數(shù)據(jù)倉庫的多維模型
9.3.3 BI分析簡介
第 10章大數(shù)據(jù)平臺
10.1大數(shù)據(jù)和云計(jì)算
10.1.1大數(shù)據(jù)技術(shù)的發(fā)展變遷
10.1.2云計(jì)算簡介
10.2并行計(jì)算框架
10.2.1并行計(jì)算簡介
10.2.2共享內(nèi)存和 GPU計(jì)算
10.2.3 MPI并行
10.3分布式存儲與 Hadoop
10.3.1容器和 Docker
10.3.2 Hadoop和 MapReduce
10.3.3 Spark簡介
第 11章可重復(fù)研究與產(chǎn)品化
11.1分析報(bào)告與數(shù)據(jù)產(chǎn)品簡介
11.1.1自動化報(bào)告的常見框架
11.1.2數(shù)據(jù)產(chǎn)品簡介
11.2可重復(fù)研究
11.2.1 knitr的應(yīng)用
11.2.2 Jupyter的應(yīng)用
11.3數(shù)據(jù)產(chǎn)品的設(shè)計(jì)與開發(fā)
11.3.1 Shiny基礎(chǔ)
11.3.2動態(tài)交互的數(shù)據(jù)產(chǎn)品
第 12章數(shù)據(jù)科學(xué)的行業(yè)應(yīng)用
12.1互聯(lián)網(wǎng)行業(yè)
12.1.1互聯(lián)網(wǎng)行業(yè)的數(shù)據(jù)
12.1.2互聯(lián)網(wǎng)行業(yè)的數(shù)據(jù)科學(xué)應(yīng)用
12.1.3分析示例
12.2零售行業(yè)
12.2.1零售行業(yè)的數(shù)據(jù)
12.2.2零售行業(yè)的數(shù)據(jù)科學(xué)應(yīng)用
12.2.3分析示例
12.3金融行業(yè)
12.3.1金融行業(yè)的數(shù)據(jù)
12.3.2金融行業(yè)的數(shù)據(jù)科學(xué)應(yīng)用
12.3.3分析示例
12.4醫(yī)療健康行業(yè)
12.4.1醫(yī)療健康行業(yè)的數(shù)據(jù)
12.4.2醫(yī)療健康行業(yè)的數(shù)據(jù)科學(xué)應(yīng)用
12.4.3分析示例
數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)叢書數(shù)據(jù)科學(xué)概論(數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)叢書) 節(jié)選
數(shù)據(jù)科學(xué)是大數(shù)據(jù)時代發(fā)展的必然產(chǎn)物,也是推動時代進(jìn)步的內(nèi)生動力。作為一門問題導(dǎo)向、數(shù)據(jù)驅(qū)動的交叉學(xué)科,數(shù)據(jù)科學(xué)要求研究者具備扎實(shí)的知識儲備、高效的編程能力以及廣闊的研究視野。本書嘗試以概論的形式對數(shù)據(jù)科學(xué)的緣起、內(nèi)涵、技術(shù)、工具、原則、方法、平臺、產(chǎn)品、應(yīng)用等展開討論,幫助讀者建立完整的知識體系與專業(yè)邏輯。全書劃分為四個部分:**部分是緒論,鳥瞰數(shù)據(jù)科學(xué)的概念、歷史與應(yīng)用;第二部分是基礎(chǔ)技能,涵蓋編程工具、數(shù)學(xué)基礎(chǔ)與統(tǒng)計(jì)原則;第三部分是分析方法,遵從從探索性到驗(yàn)證性的數(shù)據(jù)分析思路,闡釋數(shù)據(jù)可視化方法,講解面向結(jié)構(gòu)化數(shù)據(jù)的機(jī)器學(xué)習(xí)與人工智能模型,并討論非結(jié)構(gòu)化數(shù)據(jù)的分析技術(shù);第四部分是數(shù)據(jù)應(yīng)用,從業(yè)界視角介紹數(shù)據(jù)庫、大數(shù)據(jù)平臺、可重復(fù)研究的理念與實(shí)踐,并以互聯(lián)網(wǎng)、零售、金融、醫(yī)療健康四個行業(yè)為例展開實(shí)戰(zhàn)討論。為適應(yīng)時代要求,全書示例盡量以 R和 Python對照展開,方便讀者掌握不同的分析工具。為提供教學(xué)便利,作者分別準(zhǔn)備了基于 Beamer和 PowerPoint的課件素材,在中國人民大學(xué)出版社網(wǎng)站( www.crup.com.cn)提供下載,并秉承開源思想將所有數(shù)據(jù)與代碼共享于 https://github.com/rucliyang/Intro2ds。近二十年,兩位作者分別修讀了統(tǒng)計(jì)學(xué)博士、軟件工程碩士與管理學(xué)博士學(xué)位,并長期活躍于基于數(shù)據(jù)科學(xué)技術(shù)的統(tǒng)計(jì)咨詢一線,在互聯(lián)網(wǎng)、市場研究、生物醫(yī)藥、金融、教育心理等領(lǐng)域積累了豐富的實(shí)踐經(jīng)驗(yàn),希冀從不同視角為大家展開數(shù)據(jù)科學(xué)的畫卷。
數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)叢書數(shù)據(jù)科學(xué)概論(數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)叢書) 作者簡介
李揚(yáng) 中國人民大學(xué)統(tǒng)計(jì)學(xué)院教授、博士生導(dǎo)師,副院長、統(tǒng)計(jì)咨詢研究中心主任;國際統(tǒng)計(jì)學(xué)會推選會員、中國商業(yè)統(tǒng)計(jì)學(xué)會副會長、北京生物醫(yī)學(xué)統(tǒng)計(jì)與數(shù)據(jù)管理研究會監(jiān)事長、北京大數(shù)據(jù)協(xié)會綜合評價(jià)專業(yè)委員會主任委員。主要從事相關(guān)型數(shù)據(jù)分析、模型選擇與不確定性評價(jià)、潛變量建模、臨床試驗(yàn)設(shè)計(jì)等領(lǐng)域研究,承擔(dān)國家自然科學(xué)基金面上項(xiàng)目、全國統(tǒng)計(jì)科學(xué)研究重大項(xiàng)目等科研項(xiàng)目二十余項(xiàng),發(fā)表JASA、JAMA IM、Biometrics、Biostatistics、統(tǒng)計(jì)研究等國內(nèi)外期刊研究論文五十余篇。李艦 統(tǒng)計(jì)學(xué)本科、軟件工程碩士、商學(xué)博士,數(shù)據(jù)科學(xué)領(lǐng)域的多年從業(yè)者,見證并參與了統(tǒng)計(jì)學(xué)從冷門專業(yè)到顯學(xué)的過程。是“統(tǒng)計(jì)之都”社區(qū)的核心成員之一、一些開源社區(qū)的活躍貢獻(xiàn)者,致力于數(shù)據(jù)科學(xué)在實(shí)體行業(yè)的應(yīng)用。著有《統(tǒng)計(jì)之美》《數(shù)據(jù)科學(xué)中的R語言》。
- >
龍榆生:詞曲概論/大家小書
- >
中國歷史的瞬間
- >
唐代進(jìn)士錄
- >
朝聞道
- >
【精裝繪本】畫給孩子的中國神話
- >
羅庸西南聯(lián)大授課錄
- >
山海經(jīng)
- >
名家?guī)阕x魯迅:朝花夕拾