-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
數據標注工程(第2版) 版權信息
- ISBN:9787302625179
- 條形碼:9787302625179 ; 978-7-302-62517-9
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
數據標注工程(第2版) 本書特色
《數據標注工程(第2版)》可作為人工智能訓練師專業教材,也可作為大數據和人工智能應用人才的專業教材以及廣大數據標注行業從業者的學習資料。 幫助讀者了解數據標注,學習數據標注為宗旨,敘述簡明扼要,內容通俗易懂。可以幫助讀者快速建立信息,提升技巧。
數據標注工程(第2版) 內容簡介
《數據標注工程(第2版)》由數據標注行業的專家團隊編寫,采用通俗易懂的方式,系統地介紹了數據標注的基本概念、分類、流程、質量管理、安全、項目管理、平臺和應用等內容。本書通過理論與實戰相結合的方式,幫助讀者由淺入深進行學習,讓讀者真正掌握數據標注的核心技術、數據標注工程實施和管理方法。
數據標注工程(第2版) 目錄
第1 章 數據標注概述
1.1 數據標注的起源與發展 1
1.1.1 什么是數據標注 3
1.1.2 數據標注分類概述 4
1.1.3 數據標注流程概述 7
1.2 數據標注的應用案例 8
1.2.1 出行行業 8
1.2.2 金融行業 8
1.2.3 醫療行業 9
1.2.4 家居行業 9
1.2.5 安防行業 9
1.2.6 公共服務 10
1.2.7 電子商務 10
1.3 新職業-人工智能訓練師 10
1.3.1 有多少智能,就有多少人工 10
1.3.2 讓AI 更懂人類的新職業 11
1.3.3 *后一批人工智能的“老師” 16
1.4 數據越多,智能越好 17
1.5 作業與練習 19
參考文獻 19
第2 章 數據采集與清洗
2.1 數據采集 21
2.1.1 數據采集方法 21
2.1.2 數據采集流程 22
2.1.3 標注數據采集案例 24
2.2 數據清洗 26
2.2.1 數據清洗方法 27
2.2.2 數據清洗流程 28
2.2.3 數據清洗的評判 29
2.2.4 數據清洗實例 29
2.3 作業與練習 31
參考文獻 31
第3 章 數據標注分類及應用
3.1 圖像標注 33
3.1.1 什么是圖像標注 33
3.1.2 圖像標注任務類型 34
3.1.3 圖像標注方式 35
3.1.4 圖像標注案例 37
3.2 語音標注 40
3.2.1 什么是語音標注 40
3.2.2 語音標注任務類型 40
3.2.3 案例分享:方言片段截取標注 42
3.3 文本標注 43
3.3.1 什么是文本標注 43
3.3.2 文本標注類型 44
3.3.3 文本標注應用領域 45
3.4 視頻數據標注 47
3.4.1 什么是視頻數據標注 47
3.4.2 視頻與圖像數據標注的差異 47
3.4.3 視頻數據標注的分類 48
3.5 作業與練習 48
參考文獻 48
第4 章 數據標注流程及管理
4.1 數據標注項目流程 49
4.1.1 項目啟動 50
4.1.2 項目規劃 51
4.1.3 項目執行 52
4.1.4 項目監控 52
4.1.5 項目收尾 53
4.2 數據標注團隊架構 53
4.2.1 標注團隊組建 54
4.2.2 標注團隊架構 55
4.3 數據標注角色分工 56
4.4 數據標注團隊溝通 57
4.4.1 項目相關方管理 57
4.4.2 團隊溝通建設 58
4.5 數據標注安全管理 60
4.5.1 數據安全的重要性 60
4.5.2 數據信息泄露案例 60
4.5.3 數據安全管理 61
4.6 數據標注標準化管理 63
4.6.1 項目管理 65
4.6.2 人員管理 68
4.6.3 訂單管理 68
4.6.4 客戶關系管理 69
4.7 作業與練習 70
參考文獻 70
第5 章 數據標注質量管理
5.1 數據質量影響算法效果 71
5.2 數據標注質量標準 73
5.2.1 圖像標注質量標準 73
5.2.2 語音標注質量標準 75
5.2.3 文本標注質量標準 76
5.3 數據標注質量檢驗方法 76
5.3.1 實時檢驗 76
5.3.2 全樣檢驗 77
5.3.3 抽樣檢驗 78
5.4 數據標注質量風險控制 80
5.5 作業與練習 81
參考文獻 81
第6 章 數據標注進度管理
6.1 數據標注人效制定 82
6.1.1 定時人效測量 82
6.1.2 定量人效測量 83
6.1.3 步驟拆解人效測量 83
XIV 數據標注工程(第2 版)
6.2 數據標注進度規劃 84
6.3 數據標注進度風險控制 85
6.4 作業與練習 86
第7 章 數據標注平臺
7.1 線上平臺 87
7.1.1 竹節實戰平臺介紹 87
7.1.2 竹節平臺使用方法 87
7.1.3 AIDP 數據標注工具能力說明 89
7.2 線下平臺 119
7.2.1 標注工具安裝環境搭建 119
7.2.2 LabelImg 標框標注工具的使用方法 123
7.2.3 Labelme 多邊形區域標注工具安裝與使用方法 130
7.3 作業與練習 134
參考文獻 134
第8 章 數據標注實戰
8.1 語音類-方言ASR 項目數據標注案例 135
8.1.1 項目需求 135
8.1.2 標注界面及功能說明 135
8.1.3 音頻分類說明 136
8.1.4 音頻裁剪說明 137
8.1.5 文字標準執行細則 138
8.2 語音類-客服錄音項目數據標注案例 141
8.2.1 確定是否包含有效語音 141
8.2.2 確定語音的噪音情況 141
8.2.3 確定說話人數量 141
8.2.4 確定說話人性別 141
8.2.5 確定是否包含口音 142
8.2.6 語音內容方面 142
8.3 圖片類-OCR 數據標注案例 143
8.3.1 框選規則 143
8.3.2 文字轉寫規則 147
8.4 圖片類-人臉數據標注案例 148
8.4.1 標框標注 148
8.4.2 描點標注 150
8.5 無人駕駛2D 圖像標注案例 152
8.5.1 項目目的 152
8.5.2 標注內容 153
8.5.3 標注界面及操作方法 153
8.5.4 標注規則 154
8.6 NLP 數據泛化文本標注案例 157
8.6.1 標注目的 157
8.6.2 標注頁面 157
8.6.3 標注說明 157
8.6.4 NLP 名詞解析 165
8.6.5 標注細則 165
8.7 作業與練習 167
附錄
數據標注工程(第2版) 作者簡介
劉鵬教授,清華大學博士畢業,現任南京云創大數據科技股份有限公司總經理,兼任中國大數據應用聯盟人工智能專家委員會主任、中國信息協會教育分會人工智能教育專家委員會主任、教育部全國普通高校畢業生就業創業指導委員會委員,第45屆世界技能大賽中國區云計算選拔賽裁判長/專家指導組組長,2019年全國大學生數據建模比賽命題人,工信部云計算研究中心專家。主持科研項目40多項,發表論文80余篇,出版專業書籍30多本。出版的《云計算》教材被全國高校廣泛采用,名列知網統計的“中國高被引圖書”(計算機技術)前三甲。出版的《大數據》《深度學習》《數據挖掘》等教材也受到普遍歡迎。創辦的云計算世界(www.chinacloud.cn)和大數據世界(www.thebigdata.cn)等網站在業界有舉足輕重的影響。 李彤,男,1976年1月生于北京,1998年畢業于北京工業大學,2008年獲得北京大學新聞傳播專業碩士學位。曾在新浪網就職10余年,先后擔任互動中心總監、總編室主任等多個崗位,主要負責新浪網交互欄目內容的審查,保證了整個新浪交互頻道的安全、公司信息安全。2014年至今,在北京字節跳動擔任中國內容質量與用戶體驗平臺負責人,及各產品內容總編輯,對字節跳動旗下近50個產品內容質量安全工作。
- >
龍榆生:詞曲概論/大家小書
- >
中國人在烏蘇里邊疆區:歷史與人類學概述
- >
月亮與六便士
- >
中國歷史的瞬間
- >
煙與鏡
- >
上帝之肋:男人的真實旅程
- >
我從未如此眷戀人間
- >
伯納黛特,你要去哪(2021新版)