中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >>
玩轉大數據:SAS+R+Stata+Python

包郵 玩轉大數據:SAS+R+Stata+Python

出版社:清華大學出版社出版時間:2021-06-01
開本: 其他 頁數: 640
中 圖 價:¥108.9(5.5折) 定價  ¥198.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

玩轉大數據:SAS+R+Stata+Python 版權信息

玩轉大數據:SAS+R+Stata+Python 本書特色

本書采用雙色印刷,部分重點圖片可掃碼觀看彩圖。本書采用次加大開本印刷,使代碼的閱讀更加方便。 本書與常規介紹SAS、R語言、Stata和Python等統計軟件的書籍*大的區別在于避免只講統計分析而忽略如何高效、準確地提取主要結果,如何生成可直接用于匯報、交流或達到SCI發表要求的表格。 本書立足于目前大數據研究的現狀分三步進行講解。首先強調必須掌握的數學和統計學基礎知識;其次,根據真實世界的電子病歷及健康注冊系統的數據特征,模擬出與其復雜程度和處理難度相當的模擬數據庫;再次,針對同一研究問題,在SAS、R語言、Stata和Python中進行同步處理,詳細講解如何在這4個統計軟件中實現從數據導入、數據清洗、統計分析、整理輸出結果(表格或圖)到結果解釋的全部過程,從而可完成軟件的對比學習,達到事半功倍的效果。以上3點也是本書的特色所在。 筆者將著眼于真實世界的醫學研究,主要介紹在四個軟件中*常用的、*高效的命令及編程方法,使數據工作者能夠在短時間內掌握每個軟件的精髓,并且能夠學以致用,切實應用到自己的研究項目中解決相關問題。但本書不會過多的涉及諸如模型的比較和選擇等問題,因該類問題常是由研究課題或項目來決定的,不存在放之四海而皆準的準則。對該類問題感興趣的讀者,請查閱相關書籍或文章。 本書主要是面向在校大學生、研究生以及欲掌握SAS、R語言、Stata和Python的數據工作者,熟悉4個軟件的任意一個且欲短時間內掌握其他軟件者,尤其適合醫科學生、臨床醫生或藥企人員等醫療相關人員學習使用。 本書采用雙色印刷,部分重點圖片可掃碼觀看彩圖,本書采用次加大開本印刷,使代碼的閱讀更加方便。書中案例的數據和代碼可下載使用。本書通過對醫療領域的大數據分析案例講解SAS、R、STATA、PYTHON的聯合使用。案例生動。

玩轉大數據:SAS+R+Stata+Python 內容簡介

面對日漸復雜的大數據,科技工作者很難用單一的統計軟件高效、完美地完成從數據挖掘、數據清洗、統計分析到結果呈現的全部工作,因此需要熟悉和掌握多種統計工具,各取所長、整合使用。本書立足于大數據研究的現狀,基于實際醫療案例,介紹數學基礎知識和統計學基礎知識,SAS、R語言、Stata和Python這4款大數據常用分析工具的基礎編程知識及實踐操作。 本書主要面向在校本科生、研究生,以及要掌握SAS、R語言、Stata和Python的數據工作者,熟悉四個軟件的任意一個且想要在短時間內掌握其他軟件的讀者,也適合醫科學生、臨床醫生或藥企人員等醫療相關人員學習使用。

玩轉大數據:SAS+R+Stata+Python 目錄

目錄



第1章數學基礎1

1.1常用的數學符號1

1.2常見概念2

1.2.1集合2

1.2.2極限3

1.3微積分5

1.3.1導數與微分5

1.3.2基本初等函數的導函數和微分公式6

1.3.3導數與微分的運算法則7

1.3.4定積分與不定積分8

1.3.5基本的不定積分公式9

1.3.6定積分與不定積分的性質10

1.4線性代數11

1.4.1標量與向量11

1.4.2矩陣與線性方程組11

1.4.3行列式的定義與運算12

1.4.4矩陣的運算法則14

1.4.5特殊的矩陣16

1.4.6矩陣的秩17

1.4.7矩陣的轉置與矩陣的逆18

1.4.8特征向量與特征值18

第2章統計學基礎20

2.1概率論的基本概念20

2.2隨機變量與分布21

2.2.1隨機變量21

2.2.2累積分布函數222.2.3概率函數22

2.3隨機變量的數學特征23

2.3.1數學期望23

2.3.2期望值的規律24

2.3.3條件期望25

2.3.4協方差與相關系數25

2.3.5樣本均值和方差26

2.4常見的隨機變量分布27

2.4.1離散變量分布27

2.4.2連續變量分布28

2.5統計學基本概念32

2.5.1總體與樣本32

2.5.2參數和統計量32

2.5.3中心極限定理32

2.6統計描述32

2.6.1定量資料的統計描述32

2.6.2分類資料的統計描述34

2.7統計推斷34

2.7.1參數估計34

2.7.2假設檢驗38

2.8多因素回歸模型40

2.8.1多因素線性回歸模型40

2.8.2多因素Logistic回歸模型41

2.8.3多因素Cox回歸模型43

第3章軟件基礎總論45

3.1軟件初識45

3.1.1SAS45

3.1.2R語言45

3.1.3Stata45

3.1.4Python46

3.24個軟件的比較46

第4章SAS基礎52

4.1SAS介紹與資源52

4.1.1SAS語言及程序結構52

4.1.2SAS工作界面53

4.1.3獲得幫助54

4.2數據的導入與導出55

4.2.1導入數據55

4.2.2導出數據67

4.3SAS中常用的函數70

4.3.1字符型函數70

4.3.2數值型函數80

4.3.3日期型函數84

4.3.4特殊函數86

4.3.5其他函數89

4.4SAS變量91

4.4.1變量屬性92

4.4.2自動變量92

4.4.3變量列表的縮寫規則92

4.4.4創建變量94

4.4.5改變變量屬性96

4.4.6改變變量類型96

4.5SAS數據處理97

4.5.1選取變量97

4.5.2創建變量99

4.5.3對觀測求和100

4.5.4選取并操作部分觀測102

4.5.5循環和數組104

4.5.6數據集的橫向合并和縱向合并107

4.5.7增加數據集處理靈活性的SAS選項111

4.6SAS中常見的proc步113

4.6.1proc contents113

4.6.2proc datasets114

4.6.3proc freq116

4.6.4proc means118

4.6.5proc sort120

4.6.6proc transpose121

4.6.7proc univariate123

4.6.8proc corr125

4.6.9proc reg126

4.6.10proc logistic128

4.6.11proc lifetest129

4.6.12proc phreg130

4.7PROC SQL131

4.7.1檢索數據131

4.7.2合并數據集135

4.7.3使用PROC SQL管理表137

4.8SAS宏介紹143

4.8.1宏變量143

4.8.2宏函數147

4.8.3宏程序151

4.8.4宏參數152

4.8.5宏語言與data步153

4.8.6宏語言與PROC SQL157

4.8.7條件語句和循環語句在宏語言中的使用161

第5章R語言基礎163

5.1R語言介紹163

5.1.1R語言的特點與資源163

5.1.2RStudio使用簡介163

5.2R語言的基本規則164

5.2.1對象165

5.2.2函數使用基礎165

5.2.3擴展包166

5.2.4幫助167

5.3數據類型167

5.3.1vector167

5.3.2factor169

5.3.3date171

5.3.4matrix172

5.3.5list175

5.3.6data.frame179

5.3.7formula181

5.4常用函數介紹182

5.4.1數據的讀入和導出182

5.4.2條件判斷183

5.4.3循環186

5.4.4文本處理188

5.4.5基本作圖190

5.4.6自定義函數192

5.5常用數據處理與統計分析函數195

5.5.1單變量分析195

5.5.2雙變量、多變量分析198

5.5.3線性回歸模型200

5.5.4Logistic回歸模型202

5.5.5生存分析模型203

5.6dplyr包簡介206

5.6.1安裝dplyr包206

5.6.2dplyr包中*常用的5個函數206

5.6.3用%>%運算符連接多個函數211

5.6.4dplyr包中其他實用的函數212

5.7ggplot2包簡介214

5.7.1安裝ggplot2包214

5.7.2使用ggplot2畫圖的基本思路214

5.7.3使用geom_histogram函數繪制直方圖215

5.7.4使用geom_bar函數繪制柱狀圖217

5.7.5使用geom_boxplot函數繪制箱形圖217

5.7.6使用geom_point函數繪制散點圖220

5.7.7使用geom_smooth函數在散點圖上添加線性回歸結果223

5.7.8對圖中細節進行微調224

5.7.9將多個圖合并為一個圖225

5.7.10保存圖228

第6章Stata基礎229

6.1Stata簡介229

6.1.1界面介紹229

6.1.2在菜單欄中選擇命令230

6.1.3輸入命令代碼230

6.2獲得幫助230

6.2.1檢索關鍵詞230

6.2.2查看幫助231

6.2.3幫助建議231

6.3語法結構231

6.3.1變量集232

6.3.2by前綴233

6.3.3命令234

6.3.4=表達式234

6.3.5if表達式236

6.3.6in范圍236

6.3.7權重237

6.3.8命令選項237

6.3.9數值集合238

6.3.10文件名238

6.4數據轉換與分析239

6.4.1導入數據239

6.4.2瀏覽數據與基本描述240

6.4.3數值變量243

6.4.4文本變量247

6.4.5日期變量252

6.4.6缺失值253

6.4.7注釋變量254

6.4.8調整數據結構256

6.4.9基本描述258

6.4.10統計檢驗260

6.4.11相關分析262

6.4.12回歸分析263

6.4.13導出數據267

6.5輸出結果調用268

6.5.1一般統計命令結果調用268

6.5.2估計命令結果調用269

6.6重復命令271

6.6.1by前綴271

6.6.2foreach循環274

6.6.3forvalues循環275

6.7編程工具275

6.7.1do文件275

6.7.2標量變量276

6.7.3宏變量277

6.7.4矩陣279

6.7.5程序283

第7章Python基礎284

7.1Python的安裝284

7.1.1使用Python安裝包安裝Python 3284

7.1.2通過Anaconda安裝Python 3285

7.2常用交互式語言開發環境287

7.2.1編輯器288

7.2.2控制臺289

7.2.3變量管理器290

7.3常用數據類型、數據結構與基本語句291

7.3.1Python中的變量命名規則291

7.3.2常見的數據類型及運算291

7.3.3常見的數據結構及運算291

7.3.4**個程序295

7.3.5函數295

7.3.6常用邏輯語句298

7.4數據的導入與導出302

7.4.1數據的讀取302

7.4.2數據存儲304

7.5基礎運算常用包——NumPy 304

7.5.1基本性質304

7.5.2矢量化運算306

7.5.3NumPy中的函數306

7.5.4ndarray的軸、索引與切片309

7.5.5實戰舉例: 用NumPy進行圖像處理313

7.6數據處理常用包——Pandas316

7.6.1主要數據類型316

7.6.2對DataFrame的描述318

7.6.3缺失值的檢測與處理319

7.6.4DataFrame的索引321

7.6.5常見操作325

7.6.6字符處理專題328

7.6.7apply專題331

7.6.8groupby專題333

7.7統計分析常用包338

7.7.1單樣本t檢驗339

7.7.2獨立樣本t檢驗340

7.7.3兩個連續型變量的相關性341

7.7.4兩個分類變量的頻數統計341

7.7.5線性回歸模型342

7.7.6Logistic回歸模型345

7.7.7生存分析347

7.8繪圖常用包352

7.8.1Pandas352

7.8.2Matplotlib356

7.8.3Seaborn360

第8章軟件實踐總論366

8.1本書使用的數據集366

8.1.1病人基本信息數據集366

8.1.2診斷信息數據集367

8.1.3實驗室檢測結果數據集(一)368

8.1.4實驗室檢測結果數據集(二)368

8.1.5用藥信息數據集368

8.1.6急性心肌梗死數據集369

8.2軟件實踐步驟369

8.2.1數據清洗369

8.2.2數據準備370

8.2.3數據分析370

8.2.4結果整理370

8.2.5代碼的重復使用370

8.3實例: 擬研究的課題371

第9章SAS實踐部分372

9.1數據的清洗與管理372

9.1.1病人基本信息數據集372

9.1.2診斷信息數據集376

9.1.3實驗室檢測結果數據集(一)381

9.1.4實驗室檢測結果數據集(二)387

9.1.5用藥信息數據集390

9.2數據分析與結果整理393

9.2.1定量數據的統計描述394

9.2.2分類數據的統計描述398

9.2.3相關分析402

9.2.4線性回歸分析406

9.2.5Logistic回歸分析412

9.2.6Cox回歸分析418

第10章R語言實踐部分425

10.1數據的清洗與管理425

10.1.1病人基本信息數據集425

10.1.2診斷信息數據集431

10.1.3實驗室檢測結果數據集(一)435

10.1.4實驗室檢測結果數據集(二)439

10.1.5用藥信息數據集442

10.2數據分析與結果整理445

10.2.1定量數據的統計描述446

10.2.2分類數據的統計描述449

10.2.3相關分析452

10.2.4線性回歸分析453

10.2.5Logistic回歸分析457

10.2.6Cox回歸分析463

第11章Stata實踐部分470

11.1數據的清洗與管理470

11.1.1病人基本信息數據集470

11.1.2診斷信息數據集483

11.1.3實驗室檢測結果數據集(一)490

11.1.4實驗室檢測結果數據集(二)495

11.1.5用藥信息數據集500

11.2數據分析與結果整理504

11.2.1定量數據的統計描述504

11.2.2分類數據的統計描述511

11.2.3相關分析516

11.2.4一般線性回歸分析519

11.2.5Logistic回歸分析526

11.2.6Cox回歸分析535

11.3Stata在Meta分析中的應用545

11.3.1Meta分析簡介545

11.3.2二分類變量的Meta分析548

11.3.3連續性變量的Meta分析552

11.3.4發表偏倚分析553

第12章Python實踐部分557

12.1數據的清洗與管理557

12.1.1病人基本信息數據集557

12.1.2診斷信息數據集566

12.1.3實驗室檢測結果數據集(一)571

12.1.4實驗室檢測結果數據集(二)578

12.1.5用藥信息數據集582

12.2數據準備和數據分析584

12.2.1定量數據的統計描述584

12.2.2分類數據的統計描述587

12.2.3相關分析589

12.2.4線性回歸分析591

12.2.5Logistic回歸分析595

12.2.6Cox回歸分析602參考文獻609附錄A常用假設檢驗方法610附錄B正則表達式619附錄C系統綜述與Meta分析技術路線圖622


展開全部

玩轉大數據:SAS+R+Stata+Python 作者簡介

孫江偉 復旦大學流行病與衛生統計學專業碩士,曾在強生公司(Johnson &Johnson)任生物統計師,對國內醫藥臨床領域及國外醫療注冊系統等大數據的數據管理、數據清洗、研究設計及統計分析,有豐富的理論及實踐經驗,現于瑞典卡羅林斯卡醫學院進行衛生統計學方面的研究深造。在American Journal of Epidemiology、European Journal of Neurology等雜志發表相關領域SCI論文10篇。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 塑料撕碎机_编织袋撕碎机_废纸撕碎机_生活垃圾撕碎机_废铁破碎机_河南鑫世昌机械制造有限公司 | 球磨机 选矿球磨机 棒磨机 浮选机 分级机 选矿设备厂家 | 二手光谱仪维修-德国OBLF光谱仪|进口斯派克光谱仪-热电ARL光谱仪-意大利GNR光谱仪-永晖检测 | 全自动在线分板机_铣刀式在线分板机_曲线分板机_PCB分板机-东莞市亿协自动化设备有限公司 | 微信小程序定制,广州app公众号商城网站开发公司-广东锋火 | 全自动五线打端沾锡机,全自动裁线剥皮双头沾锡机,全自动尼龙扎带机-东莞市海文能机械设备有限公司 | 拼装地板,悬浮地板厂家,悬浮式拼装运动地板-石家庄博超地板科技有限公司 | 伸缩节_伸缩器_传力接头_伸缩接头_巩义市联通管道厂 | 上海三信|ph计|酸度计|电导率仪-艾科仪器 | 打孔器,打孔钳厂家【温州新星德牌五金工具】 | 润东方环保空调,冷风机,厂房车间降温设备-20年深圳环保空调生产厂家 | PTFE接头|聚四氟乙烯螺丝|阀门|薄膜|消解罐|聚四氟乙烯球-嘉兴市方圆氟塑制品有限公司 | TPE_TPE热塑性弹性体_TPE原料价格_TPE材料厂家-惠州市中塑王塑胶制品公司- 中塑王塑胶制品有限公司 | 磁力抛光机_磁力研磨机_磁力去毛刺机-冠古设备厂家|维修|租赁【官网】 | 杭州中策电线|中策电缆|中策电线|杭州中策电缆|杭州中策电缆永通集团有限公司 | 纯水设备_苏州皙全超纯水设备水处理设备生产厂家 | 打造全球沸石生态圈 - 国投盛世| 齿轮减速马达一体式_蜗轮蜗杆减速机配电机-德国BOSERL齿轮减速电动机生产厂家 | 南京交通事故律师-专打交通事故的南京律师 | 济南玻璃安装_济南玻璃门_济南感应门_济南玻璃隔断_济南玻璃门维修_济南镜片安装_济南肯德基门_济南高隔间-济南凯轩鹏宇玻璃有限公司 | 搬运设备、起重设备、吊装设备—『龙海起重成套设备』 | SOUNDWELL 编码器|电位器|旋转编码器|可调电位器|编码开关厂家-广东升威电子制品有限公司 | 新疆十佳旅行社_新疆旅游报价_新疆自驾跟团游-新疆中西部国际旅行社 | 肉嫩度仪-凝胶测试仪-国产质构仪-气味分析仪-上海保圣实业发展有限公司|总部 | 闭端端子|弹簧螺式接线头|防水接线头|插线式接线头|端子台|电源线扣+护线套|印刷电路板型端子台|金笔电子代理商-上海拓胜电气有限公司 | 机床导轨_导轨板_滚轮导轨-上海旻佑精密机械有限公司 | 防水试验机_防水测试设备_防水试验装置_淋雨试验箱-广州岳信试验设备有限公司 | 护腰带生产厂家_磁石_医用_热压护腰_登山护膝_背姿矫正带_保健护具_医疗护具-衡水港盛 | 数显恒温油浴-电砂浴-高温油浴振荡器-常州迈科诺仪器有限公司 | 旋振筛|圆形摇摆筛|直线振动筛|滚筒筛|压榨机|河南天众机械设备有限公司 | 搜木网 - 木业全产业链交易平台,免费搜货、低价买货! | 开平机_纵剪机厂家_开平机生产厂家|诚信互赢-泰安瑞烨精工机械制造有限公司 | 奥运星-汽车性能网评-提供个性化汽车资讯 | 安徽免检低氮锅炉_合肥燃油锅炉_安徽蒸汽发生器_合肥燃气锅炉-合肥扬诺锅炉有限公司 | 浙江富广阀门有限公司| 济南货架定做_仓储货架生产厂_重型货架厂_仓库货架批发_济南启力仓储设备有限公司 | 上海平衡机-单面卧式动平衡机-万向节动平衡机-圈带动平衡机厂家-上海申岢动平衡机制造有限公司 | pH污水传感器电极,溶解氧电极传感器-上海科蓝仪表科技有限公司 | 电磁流量计厂家_涡街流量计厂家_热式气体流量计-青天伟业仪器仪表有限公司 | 压力控制器,差压控制器,温度控制器,防爆压力控制器,防爆温度控制器,防爆差压控制器-常州天利智能控制股份有限公司 | 仓储笼_仓储货架_南京货架_仓储货架厂家_南京货架价格低-南京一品仓储设备制造公司 |