-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
數據技術應用概論(經濟管理類大學本科數據素質培養通識教材) 版權信息
- ISBN:9787030557582
- 條形碼:9787030557582 ; 978-7-03-055758-2
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
數據技術應用概論(經濟管理類大學本科數據素質培養通識教材) 內容簡介
本教材基于數據技術概念的提出,建立由數據生成、數據組織管理與數據信息汲取三個模塊構成的數據技術應用全流程體系框架。通過對計算機信息系統、抽樣技術與數據庫系統等基礎技術原理的概念化解讀,以及對網絡爬蟲與文本數據生成、SQL語言、數據預處理、回歸模型、Logistic建模、關聯規則、決策樹分類規則、K-平均聚類、神經網絡、支持向量機,集成學習、數據可視化等一系列代表性經典應用技術的提出意義、基本概念與操作規則的分層講授邏輯構建,并通過技術應用綜合系統示例,為非計算機和非統計專業的各領域人員的數據素質培養提供一個學習平臺。其中,代表性經典技術的分層講授邏輯,可滿足讀者自主選擇學習內容的要求。 《數據技術應用概論》是為落實國家大數據戰略人才培養與教育部新文科建設要求,以經濟管理類大學本科學生數據素質培養為目標編寫的一部通識教材,也可作為其他領域人員大數據應用學習的參考用書。
數據技術應用概論(經濟管理類大學本科數據素質培養通識教材) 目錄
第1章 緒論 1
1.1 數據素質培養意義 1
1.2 數據技術 4
1.3 數據技術應用體系框架 9
主要參考文獻 13
**篇 數據生成
第2章 計算機信息系統 17
2.1 計算機信息系統的構成 17
2.2 計算機信息系統的技術路線 24
主要參考文獻 29
第3章 抽樣技術 30
3.1 抽樣調查 30
3.2 網絡調查和電話調查 35
3.3 抽樣學習 37
3.4 抽樣技術的相關概念 39
主要參考文獻 42
第4章 網絡爬蟲與文本數據生成 43
4.1 網絡爬蟲概述 43
4.2 網絡爬蟲技術操作 48
4.3 文本數據生成 51
主要參考文獻 56
第二篇 數據組織管理
第5章 數據庫技術 59
5.1 數據庫技術概述 59
5.2 數據庫系統開發 62
5.3 關系數據庫 66
5.4 數據倉庫 68
主要參考文獻 70
第6章 SQL語言 71
6.1 SQL概述 71
6.2 SQL關系定義 72
6.3 SQL查詢基本結構 75
6.4 數據庫修改 82
6.5 視圖 84
主要參考文獻 85
第7章 數據預處理技術 86
7.1 數據清理 87
7.2 數據集成 90
7.3 數據歸約 92
7.4 數據變換 92
7.5 數據離散化和概念分層 94
主要參考文獻 95
第三篇 數據信息汲取
第8章 回歸模型 99
8.1 回歸模型的基礎知識 99
8.2 *小二乘法 104
8.3 其他常用回歸模型 106
主要參考文獻 108
第9章 Logistic建模技術 109
9.1 Logistic建模技術的基礎知識 109
9.2 梯度上升算法 114
9.3 其他常用的Logistic模型 119
主要參考文獻 121
第10章 關聯規則挖掘 122
10.1 關聯規則挖掘的基礎知識 122
10.2 Apriori算法 126
10.3 其他常用關聯規則挖掘算法 130
主要參考文獻 131
第11章 決策樹分類規則 132
11.1 決策樹分類規則的基礎知識 132
11.2 ID3算法 136
11.3 其他常用的決策樹分類規則算法 138
主要參考文獻 140
第12章 K-平均聚類 142
12.1 K-平均聚類的基礎知識 142
12.2 基于劃分的K-平均聚類算法 150
12.3 其他常用的聚類算法 152
主要參考文獻 155
第13章 神經網絡 156
13.1 神經網絡的基礎知識 156
13.2 BP算法 165
13.3 其他常用的神經網絡算法 177
主要參考文獻 181
第14章 支持向量機 182
14.1 支持向量機的基礎知識 182
14.2 支持向量機的SMO算法 189
14.3 其他常用的支持向量機算法 198
主要參考文獻 200
第15章 集成學習算法 201
15.1 集成學習算法的基礎知識 201
15.2 隨機森林算法 206
15.3 其他常用的集成學習算法 214
主要參考文獻 216
第16章 數據可視化 217
16.1 數據可視化的基礎知識 217
16.2 可視化設計基礎 223
16.3 數據可視化工具 228
主要參考文獻 229
第四篇 示例
第17章 系統示例 233
17.1 數據生成 233
17.2 數據組織管理 235
17.3 數據信息汲取 239
數據技術應用概論(經濟管理類大學本科數據素質培養通識教材) 節選
第1章 緒論 本教材是為培養提升高校經濟管理類專業本科學生數據素質而構建的一門通識課程教材。漢語中的“素質”指后天形成的,能夠完成某類活動所必需的基本條件。數據素質可以理解為通過學習達到的,能夠完成數據相關活動的基本能力。作為學習指導,本章將討論數據素質培養意義、數據技術概念及知識體系框架。 1.1 數據素質培養意義 1.1.1 什么是數據素質 數據素質通常可以理解為通過學習達到的,能夠完成數據相關活動的基本能力。數據活動存在技術開發與應用的區分,開發對應系統化訓練的技術專業素質,這里的應用則特指非數據技術專業的各領域人才在數據技術應用活動中需要具備的基本條件。數據技術應用素質簡稱為數據素質。 一般數據技術泛指從數據中獲取解決問題信息的各類技術。隨著數據技術進步,應用范圍擴大,應用場景變化,數據素質也相應動態變化。就當前數據技術的一般應用場景,各領域人才應具備的數據素質可大體表述為應用數據信息初步認知事物的能力,并大體可以分為三個層次。 **,對數據怎么生成的,其經過什么技術處理與組織才能獲取所需的相關信息,以及獲取的數據信息是否能有效反映現象的意義等問題有所知曉。 第二,上述問題是通過數據技術的相關基本概念和基本規則表述的,因此,學習掌握數據技術相關基本概念和基本規則成為數據認知能力的必要條件。 第三,經過一定學習實踐,具備閱讀學習大數據-人工智能相關應用文獻的初步能力;經較短培訓,具備一定實際數字項目的操作能力;對本領域現實數據活動產生興趣、發現相關問題的能力等。 1.1.2 經濟社會運行方式變革 當前,在計算機網絡信息技術推動下,涌現出線上交流與交易、智能生產與管理、智慧出行、遠程教育與醫治等一系列新技術,以及冠以數字、智能智慧、共享等稱號的各種經濟社會新形態和國家治理新模式。同時,新技術以交叉聚合、正向激勵的方式不斷發展演化,大數據出現進一步爆發式增長,驅使經濟社會運行和國家治理方式進一步加速變革。我們就像被拋向時時面對數據、處處依賴數據行為的大數據海洋場景之中,面對數據海洋中的波濤巨浪及暗流涌動,數據素質就是游泳技能,決定我們能否在數據海洋中很好地生存及搏擊暢游。除個人感受之外,經濟社會領域專業人士的數據素質還面臨數字經濟與政府數據治理推進,數據權益識別與保護等場景的現實挑戰。 1.1.3 落實國家大數據戰略 目前大數據風生水起,但其仍然沒有破除生產率悖論成長為推動實體經濟整體發展的通用技術。原因在于,不同于以物質和能量轉換為特征的歷次技術革命,信息技術革命是基于大數據,以智能化方式釋放出歷次技術革命和產業變革積蓄的巨大能量的。這一能量釋放機制高度復雜,遠非勞動力、資本和技術要素進行傳統的組合就能解決問題的,需要通過數據技術與領域技術高度融合,創建出由新技術、新基礎設施和新要素組織機制構成的新技術經濟范式。2015年,我國提出實施大數據戰略和《促進大數據發展行動綱要》。2017年,習近平總書記就實施國家大數據戰略主持中共中央政治局第二次集體學習時指出,“要構建以數據為關鍵要素的數字經濟,推動互聯網、大數據、人工智能同實體經濟深度融合,培育造就一批大數據領軍企業,打造多層次、多類型的大數據人才隊伍”。提升領域人才數據素質是推動國家大數據戰略落實的重要舉措。 一是數字經濟和政府數字治理中,相關數字系統開發要求領域用戶和數字技術人員共同確定系統開發目標與相應技術。現實中大量企業和政府機構人員因缺失相關素質而不能提出明確需求,這是經濟和數字化治理推進的*大瓶頸。解決之道在于加速培養領域專業人員的數據素質。 二是計算機信息技術是以對主體行為產生影響的信息載體定義數據的,其認為數據本身沒有價值,只有成為對主體行為產生作用的信息時,數據才有意義。我們認為,從這一語境,大數據可理解為行為主體按規則行為活動的充分、完備和系統的記錄,其中相關規則來源于領域,但其行為記錄數據卻可以超越本領域自身產生巨大外溢性,具有為其他相關領域所用的價值,由此派生出數據社會配置活動。以數據流引領技術流、物質流、資金流、人才流,將深刻影響社會分工協作的組織模式,促進生產組織方式的集約和創新。 三是與傳統商品不同,數據因存在以下五個特性,所以很難以所有權移轉方式完成配置交易。①數據具有非競爭和非排他性。數據的使用并不減少數據供應,不影響其他主體使用。②傳統生產投入存在規模報酬遞減,而數據越用信息越充分,具有規模報酬遞增特性。③數據具有多主體交互生成與共享性,權屬難以界定。④數據可無限復制。一般性掌握原生數據并沒有現實意義,數據價值來自從中獲取的能夠驅動行為的信息。⑤數據價值存在高時效性,需要實時更新。目前數據交易一般通過數據服務,特別是長期服務方式完成。對存在數據需求的各非數據技術企業而言,明確數據信息服務需求,商定服務交易價格等相關規則,是形成數據交易配置的基本條件。而對一個具體數據性質的認知則是數據素質的現實體現。應當指出,上述討論也同樣適用于社會治理數字化系統構建中的數據要素配置。 數字經濟的本質是數據要素與勞動及其資本要素的有效結合,邏輯上是以勞動要素具備一定數據素質為其結合條件的,同時該結合還表現出正向增強反饋機制,即數據應用以勞動要素具備數據素質為條件,而勞動要素基于數據素質又能提升數據應用效果,進而激勵數據技術加速進步。上述兩方面以增強反饋形成正向迭代機制。顯然,勞動要素的數據素質是數據要素發揮生產力創新動能作用的基礎,勞動者數據素質的提升具有推動數字經濟的重要現實意義。 1.1.4 數據權益識別與保護 任何技術都具有正面與負面社會效應。信息技術在催生巨大動能的同時也帶來了社會治理的巨大挑戰。其中既包括掌控大量數據資源和市場份額的互聯網科技巨頭,形成壟斷抑制競爭、侵害行為主體的信息安全與隱私權力的現象;也包括因數據具有存在方式上的虛擬性和價值實現上的聚合性等特點,出現部分信息技術企業為追求流量利潤,開發出行為可卡因產品;甚至出現網絡科技巨頭放任虛假信息影響公眾,造成社會撕裂的極端現象。數據技術的一系列社會負面影響已經引發人們的高度關注。各國政府加速構建相關治理體系,但治理體系構建及其效果,往往與公眾數據素質水平正相關。例如,如果我們知道一個從數據中獲取信息的算法是內嵌于代碼中的觀點,是被某種成功定義的優化,這一數據信息暗含提供者態度的認知,將增加一點數據識別理性,減少一點數據誤導或信息盲從。其算法相關知識則是提升數據素質需要學習的一個核心內容。顯然,數據素質為行為主體增強市場話語權、實施自我保護,乃至社會數據治理提供了重要的支撐。 1.2 數據技術 1.2.1 相關概念 嚴格說,數據技術是在一系列計算機信息相關技術基礎上形成的一個寬泛概念。相關技術主要包括以下幾個方面。 1.大數據 1998年,美國硅圖公司馬西(Mashey)基于數據快速增長現象,提出必將出現數據難理解、難獲取、難處理和難組織等四個問題,并以“BigData”描述這一挑戰。2007年,圖靈獎獲得者格雷(Gray)認為,大數據將成為人類觸摸、理解和逼近現實復雜系統的有效途徑;指出在實驗觀測、理論推導和計算仿真等三種科學研究范式后,將迎來“數據探索”的第四范式,以“數據密集型科學發現”,開啟從科研視角審視大數據的熱潮。2012年,牛津大學的舍恩伯格和庫克耶(Cukier)發表《大數據時代:生活、工作與思維的大變革》,提出數據分析將從“隨機采樣”、“精確求解”和“強調因果”的傳統模式演變為大數據時代的“全體數據”、“近似求解”和“只看關聯不問因果”的新模式,引發了商業經濟等領域的強烈反響,大數據的社會影響達到新高度。2014年后,對大數據的認知趨于理性。與大數據相關的技術、產品、應用和標準不斷發展,逐漸形成由數據資源與應用程序接口(application programming interface,API)、開源平臺與工具、數據基礎設施、數據分析、數據應用等板塊構成的大數據技術生態系統。其發展熱點呈現了從技術向應用再向治理的逐漸遷移。 應當指出,目前人們對大數據的認識表達更多集中在與傳統數據的區分。例如,大數據就是大到無法通過現有手段在合理時間內達到截取、管理、處理并整理成為人類所能解讀的信息(梅宏,2018),其具有海量性、多樣性、時效性及可變性等特征。而大數據潮流之所以興起,源于其給出的事物近似總體信息,改變了傳統數據認知范式,特別是該信息具有的巨大外溢性,成為大數據價值涌現的動力。如果將大數據理解為“行為主體按照規則行為的充分、完備和系統的記錄”,就可以貼切表達這種現象的背景。其中,規則來自領域事物管理活動要求,充分記錄內涵事物管理需要的近似總體信息。開放的充分記錄也可為其他領域所用,產生巨大正外部性。 2.數據科學 數據科學出自計算機和統計對其學科定位的再認識。1974年,圖靈獎獲得者諾爾(Naur)針對計算機的基本功能是數據處理,提出了數據科學(data science)的概念,認為“數據科學是一門基于數據處理解決問題的科學”,建議其替代計算機科學的稱謂。1985年,美國華裔統計學家吳建福在訪問中國科學院時提出,數據科學反映統計學研究現狀,可以改變對統計學不夠精確的認識偏誤,建議將統計學改稱數據科學。2000年后,大數據陡起。統計學與計算機科學力圖為大數據現象尋找一個科學解釋框架,目光聚焦于數據科學概念。出現了大量以統計或計算機與大數據現象掛鉤的方式論證數據科學的文章。其中,2012年帕蒂爾(Patil)和達文波特(Davenport)發表“數據科學家:21世紀*時髦職業”一文,以及2015年美國白宮聘請帕蒂爾擔任**任首席數據科學家的舉動,將數據科學的社會影響推向高潮。由此派生出基于統計與計算機等方面的數據科學的概念解讀。統計學提出,數據科學是收集、處理和應用數據的科學;計算機科學提出,數據科學是通過挖掘數據、處理與分析數據,從而獲取數據中信息的技術。此外,還有通過作用意義界定數據科學概念的,如數據科學是一門利用數據學習知識的學科;數據科學通過綜合統計、數據分析及其相關方法概念,理解和分析實際現象數據等。2016年我國開設數據科學與大數據技術本科專業,系統開設計算機與數據模型等方面的基礎與專業課程,培養大數據技術專業人才。顯然,數據科學與大數據技術是數據技術的重要構成。 3.數字技術與數字經濟 數字技術是20世紀90年代,針對各種傳統信息形式轉換成計算機可識別的編碼技術而提出的,包括硬件設備和軟件程序兩大部分。在計算機技術廣泛應用的今天,人們開始將基于計算機相關硬件與軟件的自動化、智能化應用系統構建與開發技術統稱為數字技術。基于數字技術的經濟活動又統稱為數字經濟。應當指出,數字技術是高度復雜的專門化技術體系,包括數字系統的構建以及數字系統的運行管理。數字系統一旦構建起來,其運行過程將產生大量數據,而且無論是自動化的還是智能化的系統,其運行都是依靠數據的。顯然,數字技術體系是個大概念,其中包含諸多數據技術。 1.2.2 數據技術概念 可從相關形成背景與形成邏輯理解數據技術這一概念。 1.數據技術概念形成相關背景 歷史上出現了大量服務各領域問題解決,歸屬相應領域的數據獲取與處理技術。例如,天文學的天象觀測技術、氣象學的氣象觀測技術、物理學的物質運動觀測技術、生物醫學的顯微觀測技術、社會經濟的統計調查技術等。可以說,幾乎自然與社會各領域都存在用于數據認知的相關技術。但直至計算機網絡技術推動下,大數據涌現才導致數據技術脫離領域專屬,成為獨立的普適性技術,形成新的社會分工。出現這一現象的背景在于,雖然大數據是基于計算機網絡技術形成的,但其富含的信息具有解決一系列復雜社會經濟問題的巨大價值,并引發生產方式與社會經濟運行方式的巨大變革。于是,現實中如
數據技術應用概論(經濟管理類大學本科數據素質培養通識教材) 作者簡介
尚翔,男,任職于天津財經大學管理信息系統系。主要研究方向為數據庫、數據倉庫、數據挖掘技術的研究與應用。目前主要從事有關人口信息系統及人口與經濟發展理論及方法的研究。曾發表論著《企業戰略決策很好路徑理論研究》;主持了天津市科委項目“主動數據庫中間件系統”的開發工作。
- >
中國歷史的瞬間
- >
史學評論
- >
莉莉和章魚
- >
龍榆生:詞曲概論/大家小書
- >
二體千字文
- >
名家帶你讀魯迅:故事新編
- >
推拿
- >
伯納黛特,你要去哪(2021新版)