中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
依存關系與語言網絡

包郵 依存關系與語言網絡

作者:劉海濤
出版社:科學出版社出版時間:2022-08-01
開本: 16開 頁數: 388
本類榜單:社會科學銷量榜
中 圖 價:¥73.5(7.5折) 定價  ¥98.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>
買過本商品的人還買了

依存關系與語言網絡 版權信息

  • ISBN:9787030727831
  • 條形碼:9787030727831 ; 978-7-03-072783-1
  • 裝幀:一般膠版紙
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>

依存關系與語言網絡 內容簡介

借助大規模真實語料探究人類語言的本質規律及其機制,是數智時代語言學家的主要任務之一。本書精選了筆者近年來的研究成果,較為系統、全面地展示了以大規模依存樹庫為基礎,圍繞語言的線性結構和網絡結構對語言這一“人驅復雜適應系統”所做的探索,其中包括已在相關領域得到廣泛認可的“依存距離*小化”和“依存方向連續統”等。全書內容豐富、結構明晰、友好易讀,較好地回答了“什么是數據驅動的語言研究”、“為什么要開展相關研究”,以及“應該如何開展”等問題。 本書不僅適合作為語言學相關專業的教學用書,也可作為人工智能、自然語言處理、認知科學、網絡科學等領域研究者的參考讀物。

依存關系與語言網絡 目錄

目錄
從無序中尋找有序
寫在前面的話
依存關系計量研究
**章 依存距離和依存方向 3
**節 依存關系的基本概念 3
第二節 依存距離作為衡量語言理解難度的計量指標 10
第三節 依存方向作為面向語序類型研究的計量指標 26
第二章 影響依存距離和依存方向的因素 39
**節 句長 39
第二節 語體 52
第三節 標注方式 63
第三章 依存距離*小化及其形成機理 83
**節 漢語依存距離的概率分布 83
第二節 30種語言的依存距離分布規律 90
第三節 交叉依存與依存距離的關系 103
第四節 組塊在降低自然語言句法復雜度中的作用 113
第四章 依存結構的計量特征及其應用 124
**節 漢語句法及類型特征 124
第二節 依存距離*小化與漢語的“VP+N1+的+N2”結構 131
第三節 羅曼語族語言的類型特征 136
第四節 依存距離和動態配價 145
第五節 依存結構層級的分布規律 159
第六節 依存距離與層級距離 166
第七節 依存結構樹句長、樹寬、樹高之間的協同關系 174
語言復雜網絡研究
第五章 語言網絡的整體特征 187
**節 語言是一個復雜網絡 187
第二節 漢語句法網絡的復雜性 201
第三節 漢語語義網絡的復雜性 208
第四節 漢語音素網絡的復雜性 215
第六章 現代漢語多層級復雜網絡研究 224
**節 引言 224
第二節 漢語多層級網絡的構建 226
第三節 漢語四個層級網絡的復雜性特征 230
第四節 從復雜網絡參數看漢語層級結構特點 234
第七章 語言網絡的局部特征 240
**節 句法在語言網絡中的作用 240
第二節 漢語句法網絡的中心節點 243
第三節 局部句法結構與網絡整體特征的關系 253
第八章 語言網絡應用研究 265
**節 基于語言網絡的語言分類 265
第二節 句法網絡與語言的形態復雜度 276
第三節 詞同現語言網絡與斯拉夫語族語言分類 285
第四節 基于句法網絡和語義網絡的語體分類 292
第五節 復雜網絡視角的翻譯研究 300
參考文獻 306
附錄一 從依存距離到語言學交叉學科研究 328
附錄二 大數據時代的語言研究 338
附錄三 數智時代的(應用)語言學雜談 356
附錄四 語言學理論研究如何應對智能時代的挑戰 368
寫在后面的話 382
展開全部

依存關系與語言網絡 節選

依存關系計量研究 **章 依存距離和依存方向 **節 依存關系的基本概念 依存語法的基本要素是依存關系(劉海濤,2009; Tesnière,1959; Hudson,2010)。(句法)依存關系具有以下基本屬性: (1)它是兩個詞之間的二元關系; (2)它通常是不對稱的,在構成依存關系的兩個詞中,一個是支配詞,另一個是從屬詞; (3)它是有標記的。 基于這三種屬性,我們可以構建一個句法依存樹或有向依存圖來表示句子的句法結構。在本書中,我們一般使用有向非循環圖來表示句子的依存結構。圖1-1為漢語句子“他有三本書”的依存句法分析。 圖1-1 句子“他有三本書”的依存句法結構有向圖 從圖1-1可以看出,句子中的所有單詞都由句法依存關系連接在了一起。例如,在這個句子中,“他”(代詞,r)通過 subj(主語)和“有”(動詞,v)形成一個依存關系,“有”也與“書”(名詞, n)形成了 obj(賓語)的依存關系。構成依存關系的兩個詞之間用帶有箭頭的弧線連接,連接弧從支配詞指向從屬詞。在一個句子中,只有一個詞沒有支配詞,其他詞都有支配詞。 主語和賓語依存于主動詞,而介詞(圖1-1中沒有舉例說明)依存于它們所修飾的名詞或動詞。在每對連接的詞語中,一個被稱為從屬詞,另一個被稱為支配詞。標記弧從支配詞指向從屬詞。 為了便于計算機處理圖1-1中的句法信息,我們一般將依存句法圖或樹轉換成表1-1的形式。 表1-1 句子“他有三本書”的句法分析 在表1-1中,每一行都清楚地表示了一個依存關系的構成要素,包括從屬詞、支配詞、依存類型,以及詞語在句中的位置信息。 值得注意的是,與傳統的依存結構表示不同,圖1-1、表1-1均包含詞語在句子中的位置信息。這樣做的原因主要是傳統依存句法結構圖大多是作為一種句子理解的結果而存在的,而現代的依存句法圖除具備原有的表征功能之外,也是計算機處理自然語言的重要知識源,因此,需要更多有關詞語位置的信息,以便獲得更可靠的句子理解模型。 從依存結構圖作為自然語言處理知識源的角度看,只有一個句子顯然是不夠的。因此,從20世紀90年代開始,世界上許多國家都興起了采用依存句法標注自然語料的熱潮。Witkam(2005:93)把這種現象稱為“Francaj arboj revivas, usonaj seki.as”(法國樹正在重生,美國樹正在干枯)。從短語結構轉向依存結構的原因,可能是“ PSG(短語結構—筆者注)樹好比牛頓的經典力學, DG(依存結構—筆者注)圖好比愛因斯坦的相對論。后者涵蓋并升華了前者”(李維、郭進,2020:120)。 如果一個經過句法分析或標注的句子會形成一個如圖1-1的圖(樹),那么多個句子就會形成多個圖(樹)。一個含有成千上萬個句子的語料庫,經過句法標注,就會形成一個句法結構樹的倉庫,這就是“樹庫”(treebank)這個詞的由來。樹庫是現代計算語言學研究中的重要語言資源。例如,由全世界眾多語言學家與自然語言處理研究者聯合推出的 UD語言資源項目的昀新版本(2.9版本)(Nivre et al.,2016,2020)已包括122種語言的217個依存句法標注樹庫。 當然,這些資源理論上也有益于語言學家從真實的語料中發現語言系統的運作規律,有助于應對語言研究從“花園”走向“灌木叢”時遇到的昀大挑戰—人類語言的概率性問題。但是,開展數據驅動的語言研究只有數據是不夠的,我們首先需要尋找可以用數據解決的語言學問題,并需要可以用來解決這些問題的可操作與可計量的指標,還需要挖掘這些指標與人類語言結構模式與演化規律之間的聯系。只有這樣,我們所發現的語言規律和有關語言的知識才會更可靠,也才能更好地服務于那些需要語言規律的學科,進而構擬21世紀的語言理論。 為了方便后續討論,我們先對依存結構圖進行一個簡要的形式描述。 一、依存結構圖的形式化和隨機語言 語言 L中的一個句子 S可以看作是若干個詞語的有序序列。設句子的長度(即句子中包含的詞語個數)為 n(n.1),則句子 S可以表示為一個 n元組: 其中, x(1. in)表示句子的第 i個詞語;相應地, i被稱為詞語 xi在句子S中的詞序。 對句子 S進行依存句法分析后,可以得到如圖1-1的依存句法結構圖。句子S的依存結構圖與三個因素有關:①每一個位置上的詞語;②詞語類型(Part of Speech,POS);③詞語之間的依存關系,包括支配詞、從屬詞和依存關系。前兩個因素可視為關于詞序的函數,后一個因素可視為關于詞序的二元有序對的函數。在語言 L中,當給定一種依存句法體系之后,該語言的詞語表、詞語類型表和依存關系表都隨之固定了,并不會隨著所分析句子的不同而變化。每當給定一個句子 S xx 12.xn,句子中的各個詞語及其相對位置便確定了,于是詞語可以看作是詞序的一元函數: 經過詞法分析可以得到該句子的詞語類型序列(POS 1,POS 2,.,POSn),于是詞語類型也可以看作是詞序的一元函數: 詞語之間的依存關系則可以歸結為若干個具有如下形式的有序三元組: 。 其中,依存關系的名稱 rnameij完全可以由支配詞序號 i和從屬詞序號 j來確定。因此,依存關系的名稱可被認為是關于二元有序對的一元函數: 基于此,我們可以給出語言 L中句子的依存結構圖的形式描述。在語言 L中給定一個長度為的句子 S,它的依存結構圖是一個滿足一定條件的有向圖DVEf(,,word ftag frelation ): 其中,集合W、T和R只與語言 L及其依存句法體系有關,與具體句子無關,因此,它們不是依存結構圖的構成要素。如果我們的目的只是考察依存結構圖的形式特征,那么,唯一需要考察的就是哪些位置上的詞語之間存在依存關系,這只需要在集合 V上來考察其邊集 E的性質即可。 D是依存結構圖,當且僅當其邊集 E滿足如下條件(1)~(4)(Mel’cuk,1988;Nivre,2006)。 (1)單支配詞(single-governor): 即每一個詞的支配詞至多有一個且不能是自身。 (2)單根(single-root): 即一個句子的依存結構圖有且只有一個根。我們把滿足這個條件的唯一的 x記為

依存關系與語言網絡 作者簡介

劉海濤,國際世界語學院院士,教育部“長江學者”特聘教授,國務院政府特殊津貼獲得者。浙江大學求是特聘教授,博士生導師;廣東外語外貿大學云山領軍學者,北京語言大學特聘教授。兩次獲省優秀博士論文指導教師稱號,國內外多種語言學出版物的編委會成員。連續八年入選愛思唯爾“中國高被引學者”榜單。用多種語言在數十種文、理、工出版物發表過涉及數十種人類語言的成果300余篇(部),被WOS核心庫收錄100多篇,多篇論文入選ESI熱點論文與高被引論文。12項成果獲教育部與省級社科獎。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 半容积式换热器_北京浮动盘管换热器厂家|北京亿丰上达 | TwistDx恒温扩增-RAA等温-Jackson抗体-默瑞(上海)生物科技有限公司 | 细胞染色-流式双标-试剂盒免费代做-上海研谨生物科技有限公司 | 污水提升器,污水提升泵,地下室排水,增压泵,雨水泵,智能供排水控制器-上海智流泵业有限公司 | 车件|铜件|车削件|车床加工|五金冲压件-PIN针,精密车件定制专业厂商【东莞品晔】 | 江苏大隆凯科技有限公司| 合肥风管加工厂-安徽螺旋/不锈钢风管-通风管道加工厂家-安徽风之范 | 拉伸膜,PE缠绕膜,打包带,封箱胶带,包装膜厂家-东莞宏展包装 | 上海办公室装修公司_办公室设计_直营办公装修-羚志悦装 | 扬尘在线监测系统_工地噪声扬尘检测仪_扬尘监测系统_贝塔射线扬尘监测设备「风途物联网科技」 | 重庆轻质隔墙板-重庆安吉升科技有限公司 | 传动滚筒,改向滚筒-淄博建凯机械科技有限公司 | 双舌接地线-PC68数字式高阻计-ZC36|苏海百科 | 纳米二氧化硅,白炭黑,阴离子乳化剂-臻丽拾科技 | 东莞动力锂电池保护板_BMS智能软件保护板_锂电池主动均衡保护板-东莞市倡芯电子科技有限公司 | 3d可视化建模_三维展示_产品3d互动数字营销_三维动画制作_3D虚拟商城 【商迪3D】三维展示服务商 广东健伦体育发展有限公司-体育工程配套及销售运动器材的体育用品服务商 | 纸张环压仪-纸张平滑度仪-杭州纸邦自动化技术有限公司 | 呼末二氧化碳|ETCO2模块采样管_气体干燥管_气体过滤器-湖南纳雄医疗器械有限公司 | 罗氏牛血清白蛋白,罗氏己糖激酶-上海嵘崴达实业有限公司 | 风淋室生产厂家报价_传递窗|送风口|臭氧机|FFU-山东盛之源净化设备 | 内六角扳手「厂家」-温州市威豪五金工具有限公司 | 帽子厂家_帽子工厂_帽子定做_义乌帽厂_帽厂_制帽厂 | 标准光源箱|对色灯箱|色差仪|光泽度仪|涂层测厚仪_HRC大品牌生产厂家 | 施工电梯_齿条货梯_烟囱电梯_物料提升机-河南大诚机械制造有限公司 | 桥架-槽式电缆桥架-镀锌桥架-托盘式桥架 - 上海亮族电缆桥架制造有限公司 | 威海防火彩钢板,威海岩棉复合板,威海彩钢瓦-文登区九龙岩棉复合板厂 | 电脑知识|软件|系统|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网 | 贵州成人高考网_贵州成考网 | 没斑啦-专业的祛斑美白嫩肤知识网站-去斑经验分享 | 破碎机_上海破碎机_破碎机设备_破碎机厂家-上海山卓重工机械有限公司 | PC构件-PC预制构件-构件设计-建筑预制构件-PC构件厂-锦萧新材料科技(浙江)股份有限公司 | 福州甲醛检测-福建室内空气检测_环境检测_水质检测-福建中凯检测技术有限公司 | 首页-浙江橙树网络技术有限公司 石磨面粉机|石磨面粉机械|石磨面粉机组|石磨面粉成套设备-河南成立粮油机械有限公司 | PAS糖原染色-CBA流式多因子-明胶酶谱MMP-上海研谨生物科技有限公司 | 铆钉机|旋铆机|东莞旋铆机厂家|鸿佰专业生产气压/油压/自动铆钉机 | 淘气堡_室内儿童乐园_户外无动力儿童游乐设备-高乐迪(北京) | 衬氟旋塞阀-卡套旋塞阀-中升阀门首页 | 电脑知识|软件|系统|数据库|服务器|编程开发|网络运营|知识问答|技术教程文章 - 好吧啦网 | 东莞ERP软件_广州云ERP_中山ERP_台湾工厂erp系统-广东顺景软件科技有限公司 | 万师讲师网-优质讲师培训师供应商,讲师认证,找讲师来万师 | 西门子代理商_西门子变频器总代理-翰粤百科 |