-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
自然語言標注-用于機器學習-(影印版) 版權信息
- ISBN:9787564142810
- 條形碼:9787564142810 ; 978-7-5641-4281-0
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
自然語言標注-用于機器學習-(影印版) 本書特色
在收集你的數據集(語料庫)之前定義一個清晰的標注目標 學習用于分析你的語料庫中語言內容的工具 搭建用于你的標注項目的模型和規范 檢查從基本的XML到語言標記框架這樣一些不同的標注格式 創建適合于訓練和測試機器學習算法的黃金標準語料庫 選擇用來處理你的標注數據的機器學習算法 評估測試結果并修正你的標注任務 學習如何使用用于標注文本和調整標注的輕量級軟件 “語言標注是自然語言處理的關鍵環節,但是它很少在計算語言學課程中被提及。這是一本手把手講解標注的書籍,從規范和設計到使用機器學習算法面面俱到。它必然成為本科和研究生的計算語言學課程的范本。” ——Nancy Ide Vassar學院的計算機科學教授
自然語言標注-用于機器學習-(影印版) 內容簡介
是時候創建屬于你自己的用于機器學習的自然語言訓練語料庫了。無論你使用英語、漢語或者其他任何一種自然語言, 本書都可以手把手地指導你一種經驗證的標注開發周期——把元語添加到你的訓練語料庫中來幫助機器學習算法更有效工作的過程。你無需任何編程或者語言學方面的經驗就可以上手。通過每一步中的詳細示例, 你將學到“標注開發過程”是如何幫助你建模、標注、訓練、測試、評估和修正你的訓練語料庫。你也將了解到一個實際標注項目的完整演示。
自然語言標注-用于機器學習-(影印版) 目錄
preface
1. thebasics
the importance of language annotation
the layers of linguistic description
what is natural language processing?
a brief history of corpus linguistics
what is a corpus?
early use of corpora
corpora today
kinds of annotation
language data and machine learnin9
classification
clustering
structured pattern induction
the annotation development cycle
model the phenomenon
annotate with the specification
train and test the algorithms over the corpus
evaluate the results
revise the model and algorithms
summary
2. definingyourgoai and dataset
defining yoor goal
the statement of purpose
refining your goal:informativity versus correctness
background research
language resources
……
自然語言標注-用于機器學習-(影印版) 作者簡介
Jarues Plastejovsky,是Brandeis大學的教授,他在該大學的計算機科學系講解和研究人工智能及計算語言學。 Amber Stubbs,剛剛獲得了Brandeis大學標注方法論的博士學位。她現在是SUNY Albany大學的博上后。
- >
自卑與超越
- >
龍榆生:詞曲概論/大家小書
- >
經典常談
- >
中國人在烏蘇里邊疆區:歷史與人類學概述
- >
中國歷史的瞬間
- >
史學評論
- >
唐代進士錄
- >
煙與鏡