-
>
蜜蜂的寓言:私人的惡德,公眾的利益
-
>
世界貿易戰簡史
-
>
日本的凱恩斯:高橋是清傳:從足輕到藏相
-
>
近代天津工業與企業制度
-
>
貨幣之語
-
>
眉山金融論劍
-
>
圖解資本論
面向宏觀經濟風險的監測預警指標體系構建與建模 版權信息
- ISBN:9787030712363
- 條形碼:9787030712363 ; 978-7-03-071236-3
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
面向宏觀經濟風險的監測預警指標體系構建與建模 本書特色
助力客觀真實地反映經濟運行狀況和風險情況,實現全方位、動態的監測效果,強化審計部門對經濟運行的監測、預警、預測能力,提升宏觀管理效能。
面向宏觀經濟風險的監測預警指標體系構建與建模 內容簡介
宏觀經濟風險監測預警是國家審計工作的重點內容之一。本書旨在將大數據時代下新的數據和分析方法與宏觀經濟風險研究相結合,建立面向宏觀經濟風險的監測預警指標體系,并開展基于經濟大數據的方法體系與案例研究。本書中的成果有重要的科學意義和實踐指導價值。一方面,基于自然語言處理和機器學習的方法論及實踐研究將推動大數據技術方法在經濟研究中的應用。另一方面,項目組建設的宏觀經濟指數體系未來將成為宏觀經濟風險監管與防控的重要工具,助力客觀真實地反映經濟運行狀況和風險情況,實現全方位、動態的監測效果,強化審計部門對經濟運行的監測、預警、預測能力,提升宏觀管理效能。
面向宏觀經濟風險的監測預警指標體系構建與建模 目錄
第1章 緒論 1
第2章 宏觀經濟指標庫的構建及應用 3
2.1 宏觀經濟指標庫的數據來源 3
2.1.1 政府維度 3
2.1.2 市場維度 3
2.1.3 民眾生活維度 4
2.1.4 規范化文本維度 4
2.2 宏觀經濟指標庫的構建流程 4
2.2.1 基于國家統計局的宏觀經濟指標 6
2.2.2 基于文本數據加工的宏觀經濟指標 6
2.2.3 基于教科書及中文文獻庫的宏觀經濟指標 7
2.2.4 多數據源宏觀經濟指標合并及經濟分類 8
2.3 宏觀經濟指標庫的驗證及結構分析 8
2.3.1 宏觀經濟指標庫的驗證 8
2.3.2 宏觀經濟指標庫的結構分析 9
2.4 宏觀經濟指標庫的應用分析 11
2.4.1 應用實例一:多源文本的經濟主題分析 11
2.4.2 應用案例二:省區市政府工作報告的主題時間序列分析 15
第3章 經濟指標建模的一般性方法(一):混頻指標短期預測 27
3.1 引言 27
3.2 混頻LSTM模型 28
3.2.1 問題定義 28
3.2.2 整體模型架構 29
3.2.3 分離特征模型 29
3.2.4 組合特征模型 30
3.2.5 稀疏正則化 31
3.2.6 數據增強 31
3.3 數據實驗 32
3.3.1 數據集 32
3.3.2 結果對比 33
3.3.3 旁證數據的影響 34
3.3.4 變量貢獻度 34
3.4 結論和討論 36
第4章 經濟指標建模的一般性方法(二):不均衡樣本的學習方法 37
4.1 引言 37
4.2 文獻綜述 38
4.2.1 樣本選擇偏差與遷移學習 38
4.2.2 基于傾向分數的加權 38
4.2.3 基于特征匹配的加權 39
4.2.4 基于整體分布的加權 39
4.3 算法設計 40
4.4 實驗過程及結果 43
4.4.1 實驗數據 43
4.4.2 實驗算法 44
4.4.3 實驗結果 44
4.5 結論 46
第5章 增長指標建模案例:GDP預測建模 47
5.1 引言 47
5.2 研究概況 47
5.3 數據 48
5.3.1 GDP 48
5.3.2 解釋變量 49
5.3.3 樣本構造 50
5.4 模型簡介 52
5.4.1 LASSO回歸模型 52
5.4.2 SVR模型 52
5.4.3 RNN系列模型 53
5.5 實驗 54
5.6 結論 56
第6章 穩定指標建模案例:就業與失業指標預測建模 57
6.1 引言 57
6.2 數據與描述性統計 59
6.2.1 個人層面的全樣本行政數據 59
6.2.2 數據的預處理 60
6.3 模型構建 61
6.3.1 模型算法 61
6.3.2 樣本構建 62
6.3.3 特征分析與特征工程 63
6.3.4 基于個人層面預測的失業率計算 67
6.4 模型結果與分析 68
6.4.1 個人就業狀態預測結果 68
6.4.2 特征重要性與模型解釋 70
6.4.3 基于行政大數據的失業率預測 72
6.4.4 就業失業動態 72
6.4.5 性別與結構性失業 73
6.4.6 就業/失業人口文化程度結構 74
6.5 結論 74
第7章 民生指標建模方法研究一:人口遷入與新增確診人數趨勢關系分析 76
7.1 疫情數據初步分析 76
7.1.1 一代與非一代病例情況對比 76
7.1.2 深圳市病例數分析 78
7.2 人口遷入與新增確診人數的趨勢關系及因果量化分析 79
7.2.1 格蘭杰因果關系檢驗簡介 79
7.2.2 疫情建模方法 81
7.2.3 量化分析結果 82
7.3 研究結論與方法總結 83
第8章 民生指標建模方法研究二:新增確診人數估計的概率模型 84
8.1 引言 84
8.2 疫情數據初步分析 85
8.3 每日新增感染人數 86
8.3.1 符號說明 86
8.3.2 基本假設 87
8.3.3 似然函數 87
8.3.4 EM算法 88
8.3.5 每日新增感染人數的分析與討論 88
8.4 基于參數Bootstrap方法的每日新增感染人數的區間估計 89
8.4.1 參數Bootstrap方法 89
8.4.2 數值分析結果 89
8.5 研究結論與方法總結 92
第9章 民生指標建模方法研究三:動態傳播率模型及其在疫情分析中的應用 93
9.1 引言 93
9.2 動態傳播率模型 94
9.3 動態傳播率的函數擬合 96
9.4 動態傳播率的疫情變化估計 99
9.4.1 疫情變化估計的方法介紹 99
9.4.2 疫情變化估計的滑窗期選擇 99
9.5 研究結論與方法總結 100
第10章 民生指標建模方法研究四:基于動態增長率模型的疫情分析 102
10.1 引言 102
10.2 動態增長率模型 102
10.2.1 動態增長率模型的提出 102
10.2.2 動態增長率模型的計算 103
10.2.3 動態增長率模型與疫情變化估計 104
10.2.4 動態增長率模型擬合函數選擇 104
10.3 研究結論與方法總結 106
參考文獻 107
面向宏觀經濟風險的監測預警指標體系構建與建模 節選
第1章緒論 面向宏觀經濟風險的監測預警是審計工作的重點內容之一。宏觀經濟風險復雜性的增加,要求審計工作能夠提前識別和評估各類風險,提早采取措施防范和化解風險。 大數據的發展對宏觀經濟風險的審計監測和分析技術都產生了影響,傳統的方法難以滿足審計工作在準確性、時效性、系統性等方面的要求。 首先,數據量、數據顆粒度、數據頻率發生了極大改變。大數據技術能夠收集包羅萬象、實時更新的海量數據,數據量和數據更新頻率都有提高,這為宏觀經濟分析提供了新的“彈藥”。過去主要依靠統計學方法發揮數據的作用,然而數據量不夠充足、數據更新不及時、樣本數據存在偏差等問題難以解決。隨著全球數字化、網絡寬帶化、互聯網等應用于各行各業,數據來源和承載方式迅速擴大,數據量呈現爆發性增長的態勢。數據存儲單位從*初的MB到現在的GB、TB,甚至PB、EB級別,結構化數據和文字、圖像、音視頻等非結構化數據大量涌現。基于大數據的經濟學實證研究大量涌現。例如,Bok等(2018)利用海量銀行交易數據,對 GDP 增長做出早期估計。Baker(2015)通過約400萬家庭的全面板財務信息,分析大衰退期間家庭資產負債表、收入和消費之間的相互作用,結果表明高負債群體的消費彈性顯著高于其他群體。Askitas和Zimmermann(2013)利用重型載具每月的越境數據構建了新的經濟周期預測指標—通行費指數(toll index)。實證證明,通行費指數是生產類指標[如GNP(gross national product,國民生產總值)]良好的先行指標。越來越多的經濟學家意識到,隨著數據的爆炸式增長,當前主流經濟學所采用的模型驅動研究范式已難以滿足經濟學研究的需要,大數據環境下數據驅動的研究范式將革新未來的經濟學研究。 其次,宏觀經濟指標的構建更加多源,經濟指標建模維度更加豐富。傳統的經濟統計指標不再是唯一來源。在數據庫技術、網絡爬蟲技術、索引器等大數據技術與工具的賦能下,基于互聯網基礎產生的搜索數據、社交媒體數據等各類數據都可以被收集,并用于經濟指標的提取與預測。互聯網已經從傳統的信息傳播媒介升華為虛擬的社會空間。越來越多有關人類經濟、社會運行的數據被投射到云上。因此,在實時、交互、離散化、非結構化的海量數據中,蘊含著經濟社會運行的各種先行指標信號。在國際上,Thorsrud(2016)通過分析挪威的報紙Dagens Naringsliv,預測了經濟走勢,更全面地捕捉了經濟衰退信號。Jean等(2016)通過分析衛星夜晚燈光圖像數據,發現夜晚燈光強度與經濟發展之間有強相關性,能夠在一定程度上預測經濟收入水平。Blumenstock等(2015)利用個人手機歷史數據,預測個體的社會經濟地位,進而反映國家的資產分配與貧富差距狀況。 *后,大數據技術和分析方法的出現賦能傳統經濟學研究,推動經濟學研究方法創新變革。Hadoop、Nosql、Spark、Flink等大數據技術為海量數據存儲和計算提供場景。機器學習、深度學習、統計學習等大數據分析方法與傳統經濟分析相結合,可以減少經濟預測誤差,提升經濟預測精度。Psimopoulos(2020)使用機器學習與傳統經濟學方法對比,預測了經濟衰退。通過比較預測性能發現,支持向量機(support vector machine,SVM)模型的預測效果要優于其他方法。陳夢根和任桃萍(2020)研究了消費價格指數(consumer price index,CPI)的預測模型,并采用傳統的方法和機器學習方法進行預測和對比分析。結果表明,神經網絡模型的預測效果明顯優于傳統的回歸方法和時間序列預測方法。倪宙和芮凱(2019)通過機器學習集成模型對人民幣匯率進行預測,發現機器學習集成模型較傳統的時間序列模型和非線性模型具有更高的預測精度。大數據分析方法的應用提升了傳統經濟學研究的效能,為經濟研究開拓了新的視野與思路。 新時代下,全球風云際會,經濟全球化遭遇逆流,經濟發展的不確定性明顯增加。大數據以其豐富的信息價值,成為快速、準確監測預警宏觀經濟風險的重要保障。本書利用大數據技術優勢,科學合理地構建了基于大數據技術的宏觀經濟指標體系,并針對指標體系開展探索性分析,旨在為宏觀經濟風險監測預警提供助力。本書在第2章介紹大數據環境下宏觀經濟指標體系的構建。第3章和第4章深入探討研究兩種宏觀經濟指標建模的一般性方法。第5章至第10章分別介紹增長類風險指標、穩定類風險指標與民生類風險指標的建模預測。 第2章宏觀經濟指標庫的構建及應用 宏觀經濟指標庫的建立對監測宏觀經濟運行狀況,預判宏觀經濟運行中的各種風險有著重要的作用。本章首先介紹構建宏觀經濟指標庫的數據來源;其次,對基于自然語言處理等技術對宏觀指標提取的方法流程進行詳細說明;再次,對宏觀經濟指標庫中的宏觀經濟指標進行驗證和結構分析;*后,通過應用實例,介紹宏觀經濟指標庫的社會應用價值。 2.1 宏觀經濟指標庫的數據來源 在宏觀經濟指標庫構建前,需要評估選取合適的數據來源,確保宏觀經濟指標庫內所包含的宏觀經濟指標的科學性與全面性。因此,在選取用于提取宏觀經濟指標的文本時,本書從政府維度、市場維度、民眾生活維度以及規范化文本維度出發,搜集多維度的文本數據,旨在*大化宏觀經濟指標庫的覆蓋面。下面對構建宏觀經濟指標庫所使用到的數據進行詳細說明。 2.1.1 政府維度 本書收集了地方政府工作報告和中央工作會議數據。**部分是地方政府工作報告,包含中國31個省區市2000~2020年的政府工作報告數據,數據中部分省份,如河南、貴州、福建、甘肅等早期的政府工作報告數據存在缺失,數據總量為603篇。第二部分是中央工作會議數據,包含:2019年1月至2019年5月的國務院常務會議內容;1994~2019年中央經濟工作會議內容;1954~2019年全國人民代表大會會議內容;2013~2019年中共中央政治局會議內容。 2.1.2 市場維度 本書收集了2014年至2018年期間各金融機構研報,總計數量為846篇。 2.1.3 民眾生活維度 本書收集了2015年12月24日至2019年7月13日期間,每日播報的《新聞聯播》節目的文字稿內容,總計1269篇。 2.1.4 規范化文本維度 本書收集了具有規范化宏觀經濟指標格式的文本數據。其中,**部分為國家統計局統計數據庫中,月度數據庫、季度數據庫和年度數據庫所包含的宏觀經濟指標數據;第二部分為根據某些經濟指標,從中國知網中檢索并下載的文獻數據;第三部分為教科書數據,包含12本經濟學教科書,具體書名如表2-1所示。 2.2 宏觀經濟指標庫的構建流程 本節將對宏觀經濟指標庫構建中的流程步驟進行詳細說明。其中,**部分對基于國家統計局的宏觀經濟指標提取流程進行說明;第二部分介紹基于金融機構研報、《新聞聯播》文字稿和中央工作會議內容的宏觀經濟指標提取流程;第三部分對教科書及中文文獻庫提取宏觀經濟指標的方法進行介紹;第四部分對多數據來源提取的宏觀經濟指標的合并和分類標注過程進行說明介紹。宏觀經濟指標庫的構建流程如圖2-1所示。 2.2.1 基于國家統計局的宏觀經濟指標 本節通過jieba分詞工具包對國家統計局數據庫中的每個標準宏觀經濟指標進行分詞處理,提取分詞后的宏觀經濟指標的*后一個詞袋,形成尾詞數據集。而后,對尾詞數據集中相同的尾詞進行去重。同時,去掉數據集中不可量化的尾詞,如“工程”“機構”等。 根據生成的尾詞數據集,對國家統計局宏觀經濟指標做篩選,選出經過分詞處理后,尾詞部分在尾詞數據集中的宏觀經濟指標。*終,形成基于國家統計局的宏觀經濟指標,其中包含7718個宏觀經濟指標。 2.2.2 基于文本數據加工的宏觀經濟指標 本節通過jieba分詞工具包,分別對金融機構研報、《新聞聯播》文字稿、中央政府工作會議內容進行分詞處理,去除文本數據中多余的停用詞,如“因此”“以及”“導致”等。將分詞后的單詞按照不同的取值進行滑動組合,將單詞組合成不同的詞組,形成詞組集合。具體方法如圖2-2所示。 本節通過對生成的詞組數據集進行分析,發現詞組數據集中存在兩個問題。**,詞組數據集中存在較多和宏觀經濟指標無關的詞組,如“相對緩慢”“壓力導致”“已經逐步”等。第二,詞組數據集中詞組的頻率呈現右偏分布,出現頻率較低的詞組大多不符合宏觀經濟指標的判定。 為解決以上問題,保證宏觀經濟指標提取的準確性,本節根據自然語言處理技術中的BoW模型(bag-of-words model,詞袋模型)原理,通過Doc2Bow方法,對生成的詞組創建索引,并計算每個詞組在文本數據中的詞頻。選取5%作為高頻詞閾值,對所有詞組的詞頻統計結果進行匯總,形成詞頻統計列表,保留詞頻排名前5%的詞組。
- >
煙與鏡
- >
隨園食單
- >
史學評論
- >
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)
- >
中國歷史的瞬間
- >
二體千字文
- >
推拿
- >
月亮虎