數據分析:應用技能、思維框架與行業洞悉 版權信息
- ISBN:9787113300494
- 條形碼:9787113300494 ; 978-7-113-30049-4
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
數據分析:應用技能、思維框架與行業洞悉 本書特色
《數據分析:應用技能、思維框架與行業洞悉》 數據分析行業背景知識和盤推出,融入作者經驗與深邃思考,凝練出自我提升路徑。
數據分析:應用技能、思維框架與行業洞悉 內容簡介
本書立足于數據分析分析行業從業者中所需要的“士”型技能架構,從四個方面對數據分析的技能搭建進行了邏輯性較強且循序漸進的描述。首先帶領讀者系統地了解了數據的出現和數據分析行業的誕生、發展和現狀,幫讀者理清歷史脈絡。然后作者分別以“士”型人才的“橫”“豎”“橫”為出發點,從實踐技能、思維框架和行業上下游分析三個維度深入淺出的描述了數據分析從業者應該如何搭建自己的技能框架,以更適應這個行業未來的需求和發展。
數據分析:應用技能、思維框架與行業洞悉 目錄
第1章 尋找數據分析的本質
1.1 什么是數據
1.1.1 抽象性
1.1.2 可復制性
1.1.3 可理解性
1.1.4 掌握行業中的數據概念
1.2 有多少分析就有多少數據
1.2.1 從能源角度看技術和知識
1.2.2 數據是能源,分析是知識
1.3 數據分析行業人才缺口
1.3.1 數據分析的金字塔模型
1.3.2 數據分析行業現狀
1.3.3 數據分析行業的薪資水平
1.4 數據分析師的就業方向
1.4.1 數據清洗師
1.4.2 統計分析師
1.4.3 數據可視化工程師
1.4.4 商業智能專家
1.4.5 大數據與人工智能專家
1.4.6 數據分析項目經理
1.4.7 正確匹配興趣、能力與職業
第2章 追尋數據分析的大歷史與大未來
2.1 計算機之前的數據分析
2.1.1 *大的數據集:宇宙
2.1.2 歷史上的數據記錄
2.1.3 沒有電的“互聯網”
2.2 搭上計算機的翅膀
2.2.1 為數據分析而生的電腦
2.2.2 硬件暴漲的時代
2.2.3 硬件發展推動軟件性能增長
2.3 言必稱大數據和人工智能的時代
2.3.1 大數據與人工智能行業
2.3.2 大數據究竟有多大
2.3.3 人工智能有多智能
第3章 數據-信息-知識的認知模型
3.1 認知模型與心智模式
3.1.1 什么是認知模型
3.1.2 什么是心智模式
3.1.3 建立優秀的心智模式
3.2 歸納、演繹和類比法
3.2.1 歸納法——從特殊到一般的推理方式
3.2.2 演繹法——認識世界*穩定的方法
3.2.3 類比法——不可忽視的推理方法
3.3 信息論入門
3.3.1 為什么信息可以被量化
3.3.2 無處不在的熵和比特
3.3.3 難以消除的噪聲
3.3.4 從信息論看數據分析
3.4 數據分析的目的
3.4.1 從數據到信息
3.4.2 從信息到知識
3.4.3 用知識作出決策
第4章 選擇正確的數據分析工具
4.1 Excel——*簡單的工具暗藏玄機
4.1.1 微軟的Excel蘋果系統上的軟件
4.1.2 使用Excel進行簡單的數據處理
4.1.3 數據透視表Excel*強大的工具
4.1.4 使用Excel進行數據分析的行業
4.2 R語言——為統計分析而生的語言
4.2.1 出身平凡的R語言
4.2.2 R語言的基本操作
4.2.3 R語言強大的包
4.3 Python——人生苦短,我選Python
4.3.1 一位天才所創造的神奇語言
4.3.2 具有多副“面孔”的Python
413.3 Pvthon數據分析的現狀與未來
4.4 SAS——特定行業應用的分析工具
4.4.1 SAS的版本與安裝
4.4.2 SAS的應用行業
4.5 Tableau——數據可視化的好幫手
4.5.1 Tableau的歷史、特色、安裝與使用
4.5.2 生成可視化結果
4.5.3 成為一名終身學習的數據藝術家
4.6 正確選擇數據分析工具
4.6.1 學習曲線
4.6.2 不同數據分析工具的學習曲線
4.6.3 從職業需求選擇一門技術
第5章 不可不做的數據前處理
5.1 缺失值——*常見的數據問題
5.1.1 為什么會有缺失值
5.1.2 缺失值的分類
5.1.3 缺失值的填補方法
5.2 異常值——完美的數據并不存在
5.2.1 發現異常值
5.2.2 處理異常值
5.3 不一致性——難以發現的數據錯誤
5.3.1 橫向對比找出不一致性
5.3.2 隱藏得更深的不一致性
5.3.3 解決不一致性
第6章 統計分析的重要性
6.1 暗藏玄機的描述統計
6.1.1 平均值——*簡單的統計量
6.1.2 對比平均值和中位數
6.1.3 更多常用統計量
6.2 常見的數據分布形式
6.2.1 為什么數據分布這么重要
6.2.2 均勻分布
6.2.3 二項分布
6.2.4 幾何分布與超幾何分布
6.2.5 正態分布
6.2.6 為什么要學習數據分布
6.3 回歸分析
6.3.1 回歸的起源
6.3.2 線性回歸
6.3.3 殘差分析
6.3.4 其他的回歸分析
6.4 相關性分析
6.4.1 相關關系與因果關系
6.4.2 相關系數
6.4.3 相關性分析有什么用
6.5 其他分析方法
6.5.1 生存分析
6.5.2 聚類分析
6.5.3 方差分析
6.5.4 更多的統計分析
第7章 一勞永逸的數據分析自動化
7.1 經常被忽視的自動化
7.1.1 潛移默化的自動化
7.1.2 自動化的三個層次
7.1.3 自動化的成本與收益
7.2 數據標準化——自動化過程的先導
7.2.1 Normalization——消除量綱的影響
7.2.2 Standardization——讓不同的數據說相同的話
7.2.3 數據標準化的成功案例
7.3 一勞永逸中的“勞”和“逸”
7.3.1 自動化系統的“勞”
7.3.2 自動化系統的“久”有多久
7.3.3 數據分析的外包
第8章 數據可視化并不簡單
8.1 數據可視化的各種形式
8.1.1 柱狀圖
8.1.2 餅狀圖
8.1.3 折線圖
8.1.4 雷達圖
8.1.5 數據可視化的綜合表現形式
8.2 數據可視化的過程
8.2.1 充分理解數據的意義
8.2.2 時序數據的可視化
8.2.3 地理數據的可視化
8.2.4 分類數據的可視化
8.2.5 從現實到概念世界的過程
8.3 可視化中的平衡
8.3.1 數據顆粒度與可視化清晰度
8.3.2 信息量與簡潔度
8.3.3 異常值的處理
8.4 避免數據可視化的誤區
8.4.1 為讀者進行數據可視化
8.4.2 不要為了可視化而可視化
8.4.3 理解成本過高的可視化設計
8.4.4 可視化說明必不可少
第9章 了解數據分析的行業場景
9.1 影響各行各業的數據
9.1.1 數據是一切問題的解決方案嗎
9.1.2 從電子商務看數據的應用
9.1.3 數據成本與數據收益
9.2 醫藥行業——古老的行業插上現代的翅膀
9.2.1 電子化醫療數據
9.2.2 讓藥物更快上市
9.2.3 醫藥數據標準化與人才需求
9.2.4 重新理解大健康產業
9.3 金融行業——數據驅動的博弈場
9.3.1 你所不知道的市場
9.3.2 從感性到理性
9.3.3 數據分析行業的明珠——寬客
9.4 制造業——設數據賦能的新型制造
9.4.1 內卷化是萬用理論嗎
9.4.2 數據加持下的工廠
9.4.3 人工智能在生產中的應用
9.4.4 制造業更遠的未來
9.5 零售業——新零售究竟新在哪里
9.5.1 零售業的革命歷史
9.5.2 從多到少的變化
9.5.3 反過來的思維模式
9.5.4 數據——新零售的血液
第10章 從0開始進入數據分析行業
10.1 找好網絡時代的資源平臺
10.1.1 網絡學習平臺
10.1.2 社區溝通平臺
10.1.3 求職信息平臺
10.1.4 社會關系很重要
10.2 準備好求職簡歷與面試
10.2.1 好的簡歷長什么樣
10.2.2 面試——真的讓人那么頭疼嗎
10.3 選擇一家正確的公司
10.3.1 **步,完全確定自己的行業
10.3.2 城市,真的很重要
10.3.3 公司規模的大與小
10.3.4 其他考量因素
10.4 工作環境中的底線和規則
10.4.1 潛規則,不是暗規則
10.4.2 數據分析行業的鐵律
10.4.3 對職場陋習說“不”
第11章 數據分析師應有的思維框架
11.1 程序思維vs項目思維
11.1.1 什么是程序思維和項目思維
11.1.2 程序思維與項目思維孰高孰低
11.1.3 從程序思維到項目思維
11.2 平衡數據安全的得與失
11.2.1 不出錯和不被偷
11.2.2 越來越昂貴的成本
11.2.3 數據安全的威脅和防護技術
11.2.4 數據安全中的平衡
11.3 六頂帽思維模型
11.3.1 白色帽:公正與客觀
11.3.2 紅色帽:激情與情感
11.3.3 黑色帽:必要的壓力與警惕性
11.3.4 黃色帽:樂觀與正面的期待
11.3.5 綠色帽:不同的想法,可能的新結果
11.3.6 藍色帽:控制與組織
11.4 數據分析“士”型人才模型
11.4.1 “1”型人才、“一”型人才和“T”型人才
11.4.2 “十”型人才的誕生
11.4.3 “士”型人才,更進一步
展開全部
數據分析:應用技能、思維框架與行業洞悉 作者簡介
《數據分析:應用技能、思維框架與行業洞悉》 馬文豪北京理工大學學士,美國得州大學信息系統管理碩士,高級SAS統計程序員。曾任職多家美國藥企,主導過糖尿病、非小細胞癌、罕見病等多個藥物項目的I-IV期臨床試驗數據標準化及生物統計工作。2020年創辦公司及公眾號“砝碼數據”,開設了“SAS編程技術與項目實戰”和“SAS編程與CDISC標準”等課程,其深入淺出的講解風格受到大量學生的歡迎。李翔宇北京工業大學通信工程學士,美國得州大學信息系統管理碩士,高級系統分析師。擁有多年通信、能源、教育行業的系統分析和搭建經驗,重點研究數據分析行業發展與綜合人才素質養成機制。在美國創辦公司JNDataResolution,為創新藥企業提供合同研究服務及咨詢服務,與藥企共同加速藥物上市過程,讓臨床試驗數據產生出更大的價值。