-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
智能信息處理-漢語語料庫加工技術及應用 版權信息
- ISBN:9787030291356
- 條形碼:9787030291356 ; 978-7-03-029135-6
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
智能信息處理-漢語語料庫加工技術及應用 本書特色
《智能信息處理:漢語語料庫加工技術及應用》:智能科學技術著作叢書
智能信息處理-漢語語料庫加工技術及應用 內容簡介
本書以作者主持的國家項目、省部級項目及合作項目等為依托,以課題組近年來的研究成果為基礎,重點介紹語料庫深加工中的若干技術和方法,涉及分詞、詞性標注、句法分析、語義標注以及相關加工中的自動校對和一致性檢驗技術。同時,對語料庫加工質量的評價技術和語料庫的相關應用做了詳細介紹。各章節的順序展示了語料庫加工中由淺人深的發展過程。本書可作為計算機、語言學等專業高年級本科生、研究生教材,也可作為自然語言處理和計算語言學研究人員的參考書。
智能信息處理-漢語語料庫加工技術及應用 目錄
智能信息處理-漢語語料庫加工技術及應用 節選
《智能信息處理:漢語語料庫加工技術及應用》以作者主持的國家項目、省部級項目及合作項目等為依托,以課題組近年來的研究成果為基礎,重點介紹語料庫深加工中的若干技術和方法,涉及分詞、詞性標注、句法分析、語義標注以及相關加工中的自動校對和一致性檢驗技術。同時,對語料庫加工質量的評價技術和語料庫的相關應用做了詳細介紹。各章節的順序展示了語料庫加工中由淺人深的發展過程。《智能信息處理:漢語語料庫加工技術及應用》可作為計算機、語言學等專業高年級本科生、研究生教材,也可作為自然語言處理和計算語言學研究人員的參考書。
智能信息處理-漢語語料庫加工技術及應用 相關資料
插圖:關于語料庫(corpus)的定義主要有以下幾種:(1)McEnery和Wilson指出:“總體來說,多篇文本的集合就是語料庫,但在現代語言學中使用語料庫這個術語時,更傾向于包含更多的內涵,主要有采樣(sampling)收集、有代表性(representativeness)、規模有限(finite size)、機器可讀(machine-readable)、標準參考數據(a standard reference)等內涵特征!保2)語料庫就是某種語言在實際運用中的大量實例集合,這些例子可以是書面文本,也可以是語音形式的文本。(3)語料庫是根據外部原則選擇的電子形式的文本或文本片段的集合。該集合能夠代表一種語言,或一種語言的分支,或一種語言的變體,并可作為語言學研究使用的數據源[引。這里外部原則(external criteria)是指通過文本的交流功能來選擇文本的原則。與外部原則相對的一個概念就是內部原則(internal criteria),具體指按照文本反映的語言細節來選擇文本。在上述的幾種定義中,定義(1)使用最多,認為語料庫不是簡單收集的文本集合,而是通過采樣收集,具有代表性,規模大小可以確定,是機器可讀的標準數據。但是Kilgarriff和Grefenstette提出了異議,認為McEnery和Wilson混淆了“什么是語料庫”和“什么是好的、適合于某項語言研究的語料庫”這兩個問題,他們認為語料庫就是文本的集合。然而在具體使用中,有些研究者認為有許多文本的集合并不一定是語料庫。最具有爭議的莫過于萬維網(WWW)了。WWW剛出現時,人們因為不了解搜索引擎,也不清楚對WWW如何采樣,覺得WWW相當神秘。因此,文獻指出:“WWW不是語料庫,因為其維度未知且不斷變化,而且WWW最初也不是從語言學角度來設計的!
- >
詩經-先民的歌唱
- >
羅曼·羅蘭讀書隨筆-精裝
- >
月亮虎
- >
姑媽的寶刀
- >
經典常談
- >
有舍有得是人生
- >
小考拉的故事-套裝共3冊
- >
我從未如此眷戀人間