-
>
闖進數學世界――探秘歷史名題
-
>
中醫基礎理論
-
>
當代中國政府與政治(新編21世紀公共管理系列教材)
-
>
高校軍事課教程
-
>
思想道德與法治(2021年版)
-
>
毛澤東思想和中國特色社會主義理論體系概論(2021年版)
-
>
中醫內科學·全國中醫藥行業高等教育“十四五”規劃教材
數據可視化原理與應用: 版權信息
- ISBN:9787030688293
- 條形碼:9787030688293 ; 978-7-03-068829-3
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
數據可視化原理與應用: 內容簡介
本書共11章, 內容包括數據及可視化基礎, 數據可視化的發展及分類, 數據處理, 視覺通道, 數據可視化流程, 數據可視化工具, 時空、地理可視化, 層次網絡數據可視化, 文本及多媒體可視化, 社會網絡分析可視化以及可視化評估等, 既包括數據可視化的基本知識, 也涵蓋數據可視化的工具方法。
數據可視化原理與應用: 目錄
總序
前言
第1章 數據及可視化基礎 1
1.1 什么是大數據 1
1.1.1 大數據的定義 1
1.1.2 大數據的特征 3
1.1.3 大數據的類型 4
1.2 什么是可視化 5
1.2.1 可視化的概念 6
1.2.2 可視化技術 6
1.2.3 可視化的意義 7
1.3 數據可視化 8
1.3.1 數據可視化的概念 8
1.3.2 數據可視化的應用 10
1.4 案例——新聞可視化 11
1.4.1 新聞可視化的概念 11
1.4.2 新聞可視化的實例 12
1.5 習題與實踐 14
參考文獻 15
第2章 數據可視化的發展及分類 16
2.1 數據可視化的發展歷程 16
2.1.1 數據可視化的起源與發展 16
2.1.2 數據可視化的起落 19
2.1.3 數據可視化的復蘇 20
2.2 數據可視化的蓬勃發展 23
2.2.1 交互可視化 23
2.2.2 21世紀的可視化 24
2.3 數據可視化的分類 25
2.3.1 科學可視化 25
2.3.2 信息可視化 28
2.3.3 可視分析學 31
2.4 案例分析——南丁格爾的玫瑰圖 32
2.5 習題與實踐 36
參考文獻 36
第3章 數據處理 38
3.1 數據 38
3.1.1 數據的含義 38
3.1.2 可視化數據類型及特點 39
3.1.3 數據對象及屬性 40
3.2 數據預處理 41
3.2.1 數據質量 41
3.2.2 數據清理 43
3.2.3 數據集成 44
3.2.4 數據變換 44
3.3 數據存儲 45
3.3.1 大數據存儲需求 45
3.3.2 分布式存儲 46
3.3.3 云存儲 48
3.4 數據分析 49
3.4.1 數據挖掘 50
3.4.2 經典算法 51
3.5 習題與實踐 53
參考文獻 54
第4章 視覺通道 55
4.1 視覺通道類型 55
4.1.1 定性視覺通道 55
4.1.2 定量視覺通道 60
4.1.3 定性與定量視覺通道 62
4.2 視覺通道的特性 64
4.2.1 視覺通道的表現力和有效性 64
4.2.2 視覺通道的表現力判斷標準 65
4.3 習題與實踐 67
參考文獻 67
第5章 數據可視化流程 68
5.1 可視化流程模型 68
5.1.1 可視化流程模型分類 68
5.1.2 通用模型 70
5.1.3 信息可視化參考流程模型 71
5.2 可視化編碼 72
5.2.1 標記和視覺通道 72
5.2.2 編碼元素和級別 76
5.3 可視化結果處理 76
5.3.1 視圖選擇與交互設計 77
5.3.2 可視化中的美學要素 78
5.3.3 可視化隱喻 79
5.4 習題與實踐 81
參考文獻 81
第6章 數據可視化工具 82
6.1 可視化軟件 82
6.1.1 可視化軟件分類 82
6.1.2 科學可視化軟件 83
6.1.3 信息可視化軟件 89
6.1.4 可視化分析軟件 97
6.2 可視化編程工具 99
6.2.1 R語言 99
6.2.2 JavaScript語言 103
6.2.3 Processing語言 106
6.2.4 Python語言 107
6.3 案例——COVID-19確診、死亡、治愈人數統計 109
6.4 習題與實踐 120
參考文獻 120
第7章 時空、地理可視化 122
7.1 時序數據可視化 122
7.1.1 時序數據的基本概念 122
7.1.2 時序數據的可視化方法 123
7.1.3 流數據可視化 125
7.2 空間數據可視化 127
7.2.1 一維數據可視化 127
7.2.2 二維數據可視化 128
7.2.3 三維數據可視化 130
7.2.4 向量數據可視化 133
7.2.5 張量數據可視化 133
7.3 地理數據可視化 134
7.3.1 地圖投影 135
7.3.2 點型數據可視化 136
7.3.3 線型數據可視化 137
7.3.4 區域數據可視化 139
7.4 案例分析——紐約地鐵客流量數據 140
7.5 習題與實踐 142
參考文獻 143
第8章 層次網絡數據可視化 145
8.1 層次數據可視化 145
8.1.1 樹與隨機樹的概念 145
8.1.2 海量信息的層次化組織 146
8.1.3 層次數據的獲取 148
8.1.4 層次數據可視化的方法 150
8.2 層次數據比較可視化 157
8.2.1 層次數據比較可視化的必要性 157
8.2.2 層次數據比較可視化方法 158
8.2.3 層次數據比較可視化中的交互 161
8.3 網絡數據可視化 161
8.3.1 復雜網絡的復雜性與多維性 162
8.3.2 多維復雜網絡數據可視化算法 163
8.3.3 網絡數據可視化的方法 164
8.3.4 網絡數據可視化的主要工具 166
8.4 習題與實踐 167
參考文獻 168
第9章 文本及多媒體可視化 169
9.1 文本數據分析 169
9.1.1 文本檢索 170
9.1.2 文本規范化 171
9.1.3 文本分類 172
9.1.4 文本數據挖掘 174
9.2 文本可視化 176
9.2.1 文本可視化的必要性 176
9.2.2 文本可視化的類型 176
9.2.3 文本可視化工具和語言 179
9.3 多媒體可視化 181
9.3.1 圖像特征抽取 182
9.3.2 聲音特征抽取 183
9.4 習題與實踐 185
參考文獻 185
第10章 社會網絡分析可視化 186
10.1 社會網絡 186
10.1.1 社會網絡的概念 186
10.1.2 社會網絡的原理 190
10.2 社會網絡分析可視化介紹 192
10.2.1 社會網絡分析 192
10.2.2 社會網絡可視化應用 194
10.3 社會網絡分析軟件 197
10.3.1 UCINET 197
10.3.2 UCINET應用 201
10.4 案例——微博可視化 214
10.4.1 微博可視化的必要性 214
10.4.2 基于社會網絡分析的微博數據獲取 215
10.4.3 基于社會網絡中心性分析的微博信息傳播研究 216
10.5 習題與實踐 220
參考文獻 221
第11章 可視化評估 222
11.1 可視化的價值 222
11.1.1 知識價值 223
11.1.2 相對價值 223
11.1.3 成本控制 224
11.1.4 用戶因素 224
11.2 可視化評估方法 224
11.2.1 評估方法分類 224
11.2.2 定量評估 225
11.2.3 定性評估 228
11.3 習題與實踐 230
參考文獻 230
數據可視化原理與應用: 節選
第1章 數據及可視化基礎 起源于人類活動的大數據*終要服務于人類,大數據在信息空間中無處不在。從時空地理數據,到日常生活中的文本數據,以及社會媒體中的在線社交數據,都是數據的存在形式,而如何對海量的數據進行分析,首先需要理解數據的本質,再借助帶有機器智能的計算機按照數據處理流程進行基本的數據分析。通過計算機等硬件設施對數據進行獲取、存儲、傳輸和分析,在這一過程中,需要一種信息交流的通道,實現人眼的感知能力與智能設備的交互,而可視化就可以通過將數據映射為符號、顏色、紋理、圖片等,高效傳遞有用的信息。海量數據與可視化技術的結合,能夠相得益彰,按照數據可視化的流程進行,使用數據可視化工具,*終將大數據分析和挖掘的結果通過形象化和可讀性強的圖形表示,達到快速高效理解的目的。 本章介紹數據及可視化基礎,對本章概念和定義的學習,可以為后續章節的學習奠定基礎。通過學習數據及可視化基礎,可以對時空、地理數據,文本數據,社交數據等不同類型的數據,按照可視化流程,使用不同的可視化工具進行分析處理,可視化展示數據背后的信息。 1.1 什么是大數據 迅速增長的數據量為各組織提供了新的挖掘素材,大數據的本質是信息資產。大數據是需要新處理模式才能具有更強的決策力、洞察發現力和程序優化能力的海量、高增長率和多樣化的信息資產[1]。其具有數量體積巨大、數據類型繁多、價值密度低、處理速度快等特點。本節主要就大數據的定義、特征和類型進行闡述。 1.1.1 大數據的定義 大數據[2](big data),又稱巨量資料,是指所涉及的數據資料量規模巨大到無法通過人腦甚至主流軟件工具,在合理時間內擷取、管理、處理并整理成為幫助企業經營決策更積極的資訊。麗莎 亞瑟(Lisa Arthur)在《大數據營銷:如何讓營銷更具吸引力》一書中將大數據定義成紛繁雜亂的互動的應用程序、信息和流程,把大數據比喻為數據“毛球”。大數據一詞自2008年被提出至今,很多領域以及企業均在投入大量精力對它進行研究并有效利用。下面從三個角度定義大數據。 1. 技術分析角度 技術分析角度重點關注的是對海量、復雜數據進行分析處理,從而獲得信息和知識的技術手段。其中較為權威的觀點來自麥肯錫全球研究院(Mckinsey Global Institute, MGI)發表的《大數據:下一個創新、競爭和生產力的前沿》,該報告提出:大數據是指其大小超出了典型數據庫軟件的采集、存儲、管理和分析等能力的數據集。從表1-1中可以看到大數據的技術分析角度的解釋。 表1-1 研究者從技術分析角度對大數據的解釋 綜合來看,可以給大數據下如下兩個定義: (1) 大數據是一種難以處理的大規模數據集; (2) 大數據需要特定的技術才能完成其采集、分析、應用等。 2. 大數據應用價值角度 大數據應用價值角度強調大數據應用[3],側重于能夠從海量數據中獲得信息和知識的價值,*終目的是增加商業方面的競爭優勢。 高德納咨詢公司(Gartner Group)曾提出:大數據是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力來適應海量、高增長率和多樣化的信息資產。從表1-2中可以看到大數據的應用價值角度的解釋。 表1-2 研究者從應用價值角度對大數據的解釋 3. 大數據對社會發展影響角度 大數據對社會發展影響角度強調大數據產生的影響,主要是對社會生產方式、人類生活方式和思維范式的影響等。 數據科學家維克托 邁爾-舍恩伯格(Viktor Mayer-Sch?nberger)和肯尼思 庫克耶(Kenneth Cukier)在《大數據時代:生活、工作與思維的大變革》中提出:大數據是人們獲得新的認知、創造新的價值的源泉;大數據還是改變市場、組織結構,以及政府與公民關系的方法。哈佛大學定量社會研究中心主任蓋瑞 金(Gary King)在“Why Big Data Is a Big Deal”的演講中指出:大數據技術完全是一場數據革命(big data revolution),這場革命給政府管理、學術及商業帶來了很多顛覆式變革。他認為大數據技術將涉及人類研究的各個領域,而大數據也終將帶來一場變革,包括信息生產力和信息生產關系。 1.1.2 大數據的特征 大數據特征*早的提出者是麥塔集團(META Group,現為高德納咨詢公司)分析師道格 萊尼(C. Doug Laney),他在研究報告《3D數據管理:控制數據數量、速度及種類》中指出,數據激增的挑戰和機遇是三維的,不僅僅在通常所說的數據容量大(volume)層面,還包括數據處理速度快(velocity)以及數據種類多(variety)。 此后,研究者紛紛從特征角度去分析和理解大數據,并對這種“3V”的觀點加以豐富。其中,國際數據公司的觀點*為權威,也得到了研究者的廣泛認同,該公司在《從混沌中提取價值》中提出大數據的“4V”特征,即數據容量大、數據種類多、處理速度快、商業價值高(value),如圖1-1所示。 圖1-1 大數據的特征 在“4V”的基礎上,結合表1-3研究者對大數據特性的理解,概括大數據的特征為以下六方面: (1) 規模性。規模性也稱為數據體量巨大。目前,大數據的規模尚是一個不斷變化的指標,單一數據集的規模范圍從幾十太字節到數皮字節(PB)不等,數據量急劇增長。 (2) 多樣性。多樣性是指數據類型多樣:從生成類型上可以分為交易數據、交互數據、傳感數據;從數據來源上可以分為社交媒體、傳感器數據、系統數據;從數據格式上可以分為文本、圖片、音頻、視頻、光譜等;從數據關系上可以分為結構化數據、半結構化數據、非結構化數據;從數據所有者可以分為公司數據、政府數據、社會數據等。 (3) 高速性。高速性是指數據的增長速度快,以及要求數據訪問、處理、交付等的速度快。由于數據創建的實時性,數據創建、處理、傳輸、分析的速度都隨之加快,數據產生、獲取、存儲和分析的速度都已遠遠超過傳統系統,數據的時效性更強,隨之產生更大的價值。 (4) 價值性。價值性是指大數據價值巨大。大數據能夠通過規模效應將低價值密度的數據整合為高價值、作用巨大的信息資產。例如,假如美國社交網站Facebook有10億用戶,那么網站對這些用戶信息進行分析后,廣告商可根據分析結果精準投放廣告。對于廣告商,10億用戶的數據價值上千億美元。資料報道,2012年,運用大數據的世界貿易額已達60億美元。 (5) 易變性。易變性是指大數據具有多層結構。弗雷斯特研究公司(Forrester Research)分析師布賴恩 霍普金(Brian Hopkins)和鮑里斯 埃韋爾松(Boris Evelson)指出:大數據具有多層結構,這意味著大數據會呈現出多變的形式和類型。相較傳統的業務數據,大數據存在不規則和模糊不清的特性,因此很難甚至無法使用傳統的應用軟件進行分析。 (6) 準確性。準確性也就是真實性,包括可信性、真偽性、來源和信譽的有效性、可審計性等子特征。一方面,對于網絡環境下如此大量的數據需要采取措施確保其真實性、客觀性,這是大數據技術與業務發展的迫切需求;另一方面,通過大數據分析,真實地還原和預測事物的本來面目也是大數據未來的發展趨勢。 表1-3 研究者對“大數據”特性的理解 1.1.3 大數據的類型 大數據大致可以分為如下三類。 1. 傳統企業數據 傳統企業數據(traditional enterprise data)包括傳統供應鏈上的企業資源計劃數據、客戶關系系統的消費者數據、批發和銷售公司的庫存數據以及賬目數據等。 2. 機器和傳感器數據 機器和傳感器數據(machine-generated/sensor data)包括呼叫記錄、智能儀表上的數據、工業設備傳感器中的數據、設備日志、交易數據等。圖1-2是2011~2019年天貓“雙十一”交易數據。 圖1-2 2011~2019年天貓“雙十一”交易數據 3. 社交數據 社交數據(social data)包括用戶行為記錄、反饋數據等,如Twitter、Facebook等社交平臺數據。Facebook用戶每天共享的數據信息超過40億條,Twitter每天處理的數據量超過3.4億條。圖1-3是2018年微博用戶發布數據,可以看出微博作為社交媒體,是用戶表達的常用方式。 圖1-3 微博用戶發布數據 1.2 什么是可視化 如今,大數據和人工智能已經成為熱門話題,存在于各行各業。海量的數據以及復雜的數據關系為數據分析帶來了挑戰,如何將海量枯燥的數據通過技術轉化為人眼可識別的圖形,并且挖掘其背后蘊含的信息成為重要研究方向。而可視化就是其中重要的組成,通過可視化,數據可以以可視化圖形方式展示,更直觀地幫助人們理解數據隱藏的信息。本節就可視化概念、可視化技術以及可視化的意義對可視化展開闡述。 1.2.1 可視化的概念 “可視化”一詞源于英文“visualization”[4],譯為“形象化”、“成就展現”等。用形象化的方式將現實中存在的抽象事物、過程轉化為圖形就是可視化。圖1-4是社會網絡可視化,將社會網絡中的“人”形象地比喻為各個“節點”。 圖1-4 社會網絡可視化 用可視化展示信息的方式可以追溯到幾千年前,從古人在洞穴里繪制的圖形,到人們日常使用的地圖、科學制圖等,都是可視化的。可視化可以概括為:將數據、信息和知識轉化為形象化的視覺表達的過程,在此過程中,可以充分利用人眼的快速識別能力,用形象化的表達幫助人們進行數據解讀。 數據:對客觀事物的符號表示,如圖形符號、數字、字母等。它能對一個事實進行陳述,但是它是離散的,缺乏關聯性和目的性。信息:物質運動規律的總和,是賦予了意義的數據,是數據在信息媒介上的映射。知識:又稱復合知識,是*為復雜的數據矩陣,是以上幾種數據形態的綜合。 1.2.2 可視化技術 可視化技術*早用于科學計算,按照應用范圍可以分為科學可視化和信息可視化。當前更多的研究集中于信息可視化,以大型數據庫、網絡資源等信息集合作為研究對象,可視化以認知心理學和計算機圖形學為基礎,認知心理學解釋了人類認識和感知世界的方式,提供可視化的理論指導,計算機圖形學為可視化提供了形象化、藝術性的表現方法,可以作為可視化實現的工具。 可視化技術主要包括以下幾個方面。 1. 科學計算可視化技術 科學計算可視化技術[5]主要是針對計算或者實驗產生的數據,將其進行可視化的方法
- >
苦雨齋序跋文-周作人自編集
- >
山海經
- >
名家帶你讀魯迅:故事新編
- >
大紅狗在馬戲團-大紅狗克里弗-助人
- >
小考拉的故事-套裝共3冊
- >
有舍有得是人生
- >
伊索寓言-世界文學名著典藏-全譯本
- >
推拿