-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
大數據技能競賽知識點解析與實踐 版權信息
- ISBN:9787111731122
- 條形碼:9787111731122 ; 978-7-111-73112-2
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
大數據技能競賽知識點解析與實踐 本書特色
全國大學生大數據技能競賽、“智警杯”大數據技能競賽指導書;
依照《大數據分析與應用開發職業技能等級標準》編寫;
80 個知識點、100 個實驗全面覆蓋Linux操作系統、MySQL數據庫、主流大數據平臺、數據采集與分析、數據挖掘與可視化5項大數據核心技術;
由“青椒課堂”提供在線實訓及考試平臺支持,適用于各類大數據技能競賽輔導。
大數據技能競賽知識點解析與實踐 內容簡介
本書以大學生大數據技能競賽、“智警杯”大數據技能競賽為背景,全面系統地講述了大數據技術的基本原理和應用。本書共5章,主要介紹了Linux操作系統的常用命令和服務的使用;MySQL數據庫操作與管理、非關系型數據庫NoSQL;圍繞大數據框架講述了Hadoop技術、Hive數據倉庫等大數據組件架構的應用;數據采集與分析;數據挖掘與數據可視化、業務分析報告撰寫等內容。本書內容循序漸進,條理性強,全部內容基于項目需求進行設計,同時對所需的系統環境、軟件版本、數據等信息進行詳細說明,有助于讀者本地環境的復現和練習。為提升學習效果,書中結合實際應用提供了大量的案例,并配以完善的學習資料,包括課件、軟件、數據、源碼、答案、在線競賽模擬平臺,為讀者帶來全方位的學習體驗。掃描關注機械工業出版社計算機分社官方微信訂閱號IT有得聊,回復“73112”。即可獲取本書配套資源下載鏈接。本書既可作為大數據技能競賽的參賽輔導書,也可作為高等院校本、專科數據科學與大數據技術以及其他計算機相關專業大數據技術綜合實訓教材。
大數據技能競賽知識點解析與實踐 目錄
第1章Linux操作系統
1.1主機名配置
1.1.1設置主機名
1.1.2Hosts映射
1.2防火墻配置與管理
1.2.1防火墻操作命令
1.2.2配置防火墻規則
1.3時間同步
1.3.1同步網絡時間
1.3.2同步服務器時間
1.4定時任務管理
1.5SSH遠程訪問
1.5.1SSH協議
1.5.2SSH連接工具
1.6軟件包管理
1.6.1軟件配置
1.6.2下載安裝軟件
思考與練習
第2章數據庫技術
2.1MySQL數據庫
2.1.1MySQL的安裝
2.1.2數據庫操作管理
2.1.3數據表操作管理
2.1.4數據操作管理
2.1.5視圖
2.1.6權限管理
2.1.7備份與還原
2.1.8SQL優化
2.2非關系型數據庫NoSQL
2.2.1HBase列式數據庫
2.2.2Redis數據庫
2.2.3MongoDB文件數據庫
思考與練習
第3章大數據平臺技術
3.1Hadoop分布式大數據框架
3.1.1搭建Hadoop偽分布式集群
3.1.2搭建Hadoop完全分布式集群
3.1.3命令行方式管理HDFS
3.1.4使用開發工具連接Hadoop
集群
3.1.5Java API操作HDFS
3.1.6分布式計算框架之MapReduce
3.1.7編寫MapReduce方法
3.1.8配置Hadoop集群高可用
(HA)
3.2Hive數據倉庫
3.2.1本地模式安裝Hive數據倉庫
3.2.2Hive數據倉庫的常見屬性
3.2.3Hive DDL操作
3.2.4Hive DML操作
3.2.5Hive中的數據查詢
3.2.6Hive中的窗口函數
3.2.7案例:國內主要城市房屋出租
情況統計分析
3.3HBase數據庫
3.3.1搭建HBase偽分布式集群
3.3.2HBase的Shell操作
3.3.3HBase的Java API操作
3.3.4使用HBase的過濾器
3.3.5HBase與MapReduce的集成
3.3.6HBase與Hive的集成
3.3.7HBase與Sqoop的集成
3.4Spark技術框架
3.4.1集群安裝部署
3.4.2Spark Shell
3.4.3Spark SQL
3.4.4Spark Streaming
3.4.5Spark MLlib
3.4.6Structured Streaming實時計算
3.5大數據平臺運維與管理
3.5.1故障排查
3.5.2性能調優
3.6大數據框架應用
3.6.1協調框架:ZooKeeper
3.6.2數據收集:Flume
3.6.3數據傳輸:Sqoop
3.6.4任務調度工具:Azkaban
思考與練習
第4章數據采集與分析
目錄4.1報表數據處理
4.1.1數據預處理
4.1.2數據分析
4.2網絡信息獲取技術
4.2.1HTTP基本原理
4.2.2網頁組成
4.2.3網絡請求
4.2.4正則表達式
4.2.5XPath解析
4.2.6Beautiful Soup
4.2.7數據存儲
4.3數據統計分析
4.3.1描述性分析
4.3.2探索性分析
4.3.3缺失值分析
4.3.4方差分析
4.3.5T檢驗
4.3.6卡方檢驗
思考與練習
第5章數據挖掘與數據可視化
5.1數據挖掘
5.1.1線性回歸
5.1.2邏輯回歸
5.1.3支持向量機
5.1.4樸素貝葉斯
5.1.5決策樹
5.1.6時間序列分析
5.1.7關聯分析
5.1.8K-Means聚類
5.1.9主成分分析
5.2數據可視化
5.2.1報表可視化
5.2.2Matplotlib可視化
5.2.3Seaborn可視化
5.2.4ECharts實現數據可視化
5.2.5D3實現數據可視化
5.2.6FineBI實現數據可視化
5.2.7Tableau實現數據可視化
5.3業務分析報告撰寫
5.3.1明確背景與目的
5.3.2尋找合適數據
5.3.3數據分析與圖表
5.3.4報告結論與建議
5.3.5邏輯結構清晰
思考與練習
大數據技能競賽知識點解析與實踐 作者簡介
李輝,博士,中國農業大學計算中心兼農業大數據實驗室主任,全國大學生大數據技能競賽、全國高校大數據能力提升大賽等大數據類賽項裁判長,中國大數據技術與應用聯盟智庫專家,北京市大數據教學實踐基地負責人;曾獲中國大數據學術創新獎、全國高校人工智能與大數據教學創新獎;主講“數據庫原理及應用基礎”“Python語言程序設計”“大數據可視化分析”等本科生課程;主持新工科項目2項,發表學術論文20多篇,申請軟件著作權50多項,專利3項;出版《數據庫系統原理及MySQL應用教程》教材第1版和第2版被國內眾多院校選用,為機械工業出版社計算機分社20周年金牌作者。
青椒課堂(大數據人工智能教學實訓平臺)是依據大數據產業數字化人才能力要求,基于院校對大數據技術應用型人才培養的需求,結合企業大數據業務場景,以技術為驅動打造“青椒課堂”,助力高校大數據專業領域數字化人才培養。李輝,博士,中國農業大學計算中心兼農業大數據實驗室主任,全國大學生大數據技能競賽、全國高校大數據能力提升大賽等大數據類賽項裁判長,中國大數據技術與應用聯盟智庫專家,北京市大數據教學實踐基地負責人;曾獲中國大數據學術創新獎、全國高校人工智能與大數據教學創新獎;主講“數據庫原理及應用基礎”“Python語言程序設計”“大數據可視化分析”等本科生課程;主持新工科項目2項,發表學術論文20多篇,申請軟件著作權50多項,專利3項;出版《數據庫系統原理及MySQL應用教程》教材第1版和第2版被國內眾多院校選用,為機械工業出版社計算機分社20周年金牌作者。
青椒課堂(大數據人工智能教學實訓平臺)是依據大數據產業數字化人才能力要求,基于院校對大數據技術應用型人才培養的需求,結合企業大數據業務場景,以技術為驅動打造“青椒課堂”,助力高校大數據專業領域數字化人才培養。
大數據人工智能教學實訓平臺的設計全面落實“教、訓、用、監、評”一體化的思想和模式。從教學、實訓、使用、監控、評估等多方面注重專業人才和特色人才的培養。平臺是集專業度、便捷性、安全性及可擴展性的理實一體化教學實訓平臺,平臺主要涵蓋了教師備課、授課,學生實操、實訓,考試競賽,數據統計分析及教學規劃等全流程控制的綜合平臺。
- >
月亮虎
- >
莉莉和章魚
- >
我與地壇
- >
龍榆生:詞曲概論/大家小書
- >
巴金-再思錄
- >
羅庸西南聯大授課錄
- >
小考拉的故事-套裝共3冊
- >
伯納黛特,你要去哪(2021新版)