第1章 緒論 11.1 大數據時代 11.1.1 人類活動大數據 11.1.2 智慧城市大數據 21.1.3 體育大數據 31.1.4 健康大數據 31.2 大數據的本質 41.2.1 規模(Volume) 41.2.2 多樣(Variety) 51.2.3 價值(Value) 51.2.4 高速(Velocity) 51.3 教育大數據 6第2章 外語教學理論與 方法研究綜述 92.1 傳統外語教學理論與方法 9第1章 緒論 1
1.1 大數據時代 1
1.1.1 人類活動大數據 1
1.1.2 智慧城市大數據 2
1.1.3 體育大數據 3
1.1.4 健康大數據 3
1.2 大數據的本質 4
1.2.1 規模(Volume) 4
1.2.2 多樣(Variety) 5
1.2.3 價值(Value) 5
1.2.4 高速(Velocity) 5
1.3 教育大數據 6
第2章 外語教學理論與 方法研究綜述 9
2.1 傳統外語教學理論與方法 9
2.1.1 傳統外語教學理論 10
2.1.2 傳統外語教學方法 13
2.2 計算機輔助外語教學理論與方法 16
2.2.1 計算機輔助外語教學理論 17
2.2.2 計算機輔助外語教學工具 19
2.2.3 計算機輔助外語教學方法 20
2.3 “互聯網+”時代外語教學理論與方法 21
2.3.1 “互聯網+”時代外語教學理論 21
2.3.2 “互聯網+”時代外語教學方法 22
2.3.3 從“互聯網+”到大數據 26
第3章 大數據在外語教學過程中的應用 27
3.1 教學的準備環節 28
3.1.1 大數據服務教材編寫、評估 28
3.1.2 大數據服務教學大綱的設計 29
3.2 教學的實施過程 30
3.2.1 基于語料庫的數據驅動學習與外語教學素材 31
3.2.2 數據驅動學習與構建主義外語教學 33
第4章 大數據在外語在線學習效果評價中的應用 37
4.1 在線學習效果預測研究現狀 37
4.1.1 在線學習的產生和發展 37
4.1.2 國內外研究現狀 40
4.2 理論基礎與相關模型 42
4.2.1 基于學習效果預測的教學技術 43
4.2.2 表征學習 44
4.2.3 Hawkes過程 45
4.2.4 深度學習模型 48
4.3 基于學生行為數據的新型Hawkes過程研究 51
4.3.1 學習行為序列 52
4.3.2 表征學習行為 53
4.3.3 新型Hawkes過程提出 54
4.3.4 新型Hawkes過程實現 57
4.4 學習效果預測模型EduHawkes 62
4.4.1 量化學習效果 62
4.4.2 學習效果預測 63
4.4.3 數據集 67
4.4.4 實驗 69
第5章 外語教學數據采集 77
5.1 外語教學數據采集方法 77
5.1.1 社會調查法 77
5.1.2 開放數據源中獲取 80
5.1.3 設備數據采集 80
5.1.4 數據交易平臺 81
5.1.5 數據報采集 82
5.1.6 網絡數據爬蟲采集 82
5.1.7 日志采集 83
5.1.8 離線采集 84
5.1.9 實時采集 85
5.1.10 埋點采集 85
5.2 外語教學數據采集技術 87
5.2.1 分層數據采集 87
5.2.2 分層管道模型 88
5.2.3 分層采集進程監控 89
5.2.4 分組的雙層哈希負載均衡方法 90
5.3 外語教學數據采集方法及模型 92
5.3.1 教學情境問題 92
5.3.2 教學數據采集技術 93
5.3.3 數據采集模型建立 94
5.4 外語教學數據采集軟件 97
5.4.1 Flume 97
5.4.2 Logstash 98
5.4.3 Filebeat 99
5.4.4 八爪魚采集器 100
5.4.5 ParseHub 100
第6章 外語教學數據處理 101
6.1 外語教學數據處理方法 101
6.1.1 數據清理 101
6.1.2 數據集成 103
6.1.3 數據規約 104
6.1.4 數據變換 106
6.1.5 相似性度量 107
6.2 線上學習分析數據處理 108
6.2.1 構建模型 108
6.2.2 數據處理方法 110
6.3 外語教學數據處理框架 114
6.3.1 實時流數據處理框架 114
6.3.2 實時數據查詢處理框架 117
6.3.3 數據導入導出批處理框架 118
第7章 外語教學數據分析 121
7.1 外語教學數據分析框架 121
7.2 外語教學數據分析的流程 122
7.3 外語教學數據分析的方法 123
7.3.1 統計分析方法 123
7.3.2 數據挖掘方法 125
7.3.3 其他數據分析方法 128
7.4 外語教學數據分析使用工具 135
7.4.1 微軟數據分析工具 135
7.4.2 數理統計工具 136
7.4.3 BI工具 138
7.4.4 數據庫工具 140
7.4.5 編程工具 141
7.4.6 其他軟件 143
7.5 外語教學數據分析相關算法 143
7.5.1 C4.5決策樹算法 143
7.5.2 樸素貝葉斯算法 144
7.5.3 SVM支持向量機算法 144
7.5.4 KNN 145
7.5.5 K-Means聚類算法 145
7.5.6 CART算法 146
7.5.7 AdaBoost自適應提升算法 147
7.5.8 Apriori關聯規則算法 148
7.5.9 EM聚類算法 148
7.5.10 PageRank算法 149
第8章 外語教學數據可視化 151
8.1 外語教學數據可視化的基本模型 151
8.1.1 數據可視化過程 151
8.1.2 基本模型 152
8.2 外語教學數據可視化主要技術 153
8.2.1 基于圖表的可視化技術 153
8.2.2 面向像素可視化技術 153
8.2.3 基于層次的數據可視化技術 154
8.2.4 其他數據可視化技術 155
8.2.5 數據可視化技術的發展方向 155
8.2.6 數據可視化在應用中的注意點 156
8.3 外語教學數據可視化工具 157
8.3.1 常用工具 157
8.3.2 零編程工具 158
8.3.3 開發工具 159
8.4 外語教學數據可視化的圖表 165
8.4.1 條形圖(柱形圖) 165
8.4.2 餅圖 165
8.4.3 折線圖 166
8.4.4 散點圖 166
8.4.5 氣泡圖 167
8.4.6 樹形圖 167
8.4.7 極坐標圖 168
8.4.8 區域地圖(散點圖) 168
8.4.9 漏斗圖 169
8.4.10 魚眼/笛卡兒變形圖 170
第9章 數據安全和隱私保護 171
9.1 數據安全風險 171
9.2 管理措施 172
9.2.1 建立管理制度 172
9.2.2 信息采集告知-同意原則 172
9.2.3 單獨同意原則 173
9.2.4 *小化原則 173
9.3 技術措施 174
9.3.1 數據加密 174
9.3.2 數據脫敏 174
9.3.3 數據脫敏方式 175
9.3.4 訪問控制 176
參考文獻 177