中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
基于NLP的內容理解

包郵 基于NLP的內容理解

出版社:機械工業出版社出版時間:2023-03-01
開本: 24cm 頁數: 242頁
中 圖 價:¥69.3(7.0折) 定價  ¥99.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

基于NLP的內容理解 版權信息

  • ISBN:9787111720690
  • 條形碼:9787111720690 ; 978-7-111-72069-0
  • 裝幀:一般膠版紙
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>

基于NLP的內容理解 本書特色

適讀人群 :(1)人工智能相關專業研究員以及信息科學和計算機科學的愛好者(2)自然語言處理和機器學習中級讀者和愛好者(3)統計學或相關IT專業學生(1)作者背景資深:作者是資深AI技術專家,BAT高級算法工程師。 (2)作者經驗豐富:作者在NLP、內容理解等領域有多年實踐經驗。 (3)揭秘大模型:揭秘大模型的底層技術原理,詳解文本內容理解和生產的技術細節。 (4)解決6大難題:為內容重復理解、內容通順度識別及糾正、內容質量、標簽體系構建、文本摘要生成、文本糾錯6大內容理解難題提供基于NLP的解決方案。 (5)結合業務場景:所有內容、技術、算法均從實際業務場景出發,從問題的角度拆解問題。 (6)大量NLP算法:書中系統講解了可用于內容理解的各種NLP算法的原理和使用。 (7)包含大量案例:以實戰為導向,用案例貫穿全書。

基于NLP的內容理解 內容簡介

本書一共7章。第1章詳細介紹了文本特征的表示方法。第2章主要從應用的角度介紹了標題、段落、文章重復三種場景及三種場景的具體實現。第3章介紹了數據增強方法、句子通順度識別方法以及補全不通順內容的方法。第4章從應用的角度詳細介紹了知識問答質量體系的搭建方法。第5章主要講述了標簽體系的原理及構建過程中用到的3種主要算法。第6章介紹了文本摘要生成中兩類流行的方法、常用的數據集以及文本摘要的評價方法。第7章介紹了文本中錯誤的類型、來源,文本糾錯的常用方法與框架等。

基于NLP的內容理解 目錄

CONTENTS
目  錄
前言
第1章 文本特征表示 1
1.1 語料與語料預處理 1
1.1.1 語料和語料庫 1
1.1.2 語料預處理 2
1.2 文本特征表示方法 6
1.2.1 離散型特征表示方法 6
1.2.2 分布型特征表示方法 13
1.3 詞向量的評判標準 29
1.3.1 內部評估 29
1.3.2 外在評估 31
1.4 本章小結 34
第2章 內容重復理解 35
2.1 標題重復 35
2.1.1 標題符號規整化處理 36
2.1.2 Jieba分詞 39
2.1.3 LAC分詞 43
2.1.4 基于分詞及字符串等
方式進行重復識別 45
2.2 段落重復識別實例 47
2.2.1 段落重復識別 47
2.2.2 基于N-gram算法進行
內容去重 48
2.2.3 平滑處理技術 54
2.3 基于相似度計算的文章判重 57
2.3.1 文本相似度計算任務
的分析 57
2.3.2 距離度量方式 58
2.3.3 基于SimHash算法進行
文本重復檢測 62
2.4 本章小結 66
第3章 內容通順度識別及糾正 67
3.1 數據增強 67
3.2 基于FastText算法的句子
通順度識別 73
3.2.1 CBOW模型 74
3.2.2 FastText算法原理 75
3.2.3 FastText算法實戰 81
3.3 基于TextCNN算法的分類
任務實現 93
3.3.1 專有名詞簡介 93
3.3.2 算法介紹 94
3.3.3 參數調優經驗總結 96
3.3.4 基于Keras工具實現TextCNN算法 96
3.4 基于TextRNN算法的分類
任務實現 98
3.4.1 LSTM和BiLSTM 98
3.4.2 TextCNN和TextRNN
識別效果對比 105
3.5 基于Seq2Seq模型的
糾正策略 106
3.5.1 Seq2Seq模型原理 106
3.5.2 糾正不通順句子的方法 108
3.6 本章小結 114
第4章 內容質量 116
4.1 GBDT算法 116
4.1.1 GBDT算法概述 117
4.1.2 負梯度擬合 117
4.1.3 GBDT回歸算法 118
4.1.4 GBDT分類算法 119
4.2 XGBoost算法 121
4.2.1 從GBDT到XGBoost 121
4.2.2 XGBoost損失函數 122
4.2.3 XGBoost損失函數的
優化求解 124
4.2.4 XGBoost算法流程 125
4.2.5 XGBoost算法參數
及調優 127
4.3 知識問答質量體系的搭建 129
4.3.1 知識問答質量體系
建立的意義 130
4.3.2 整體的項目實施方案 130
4.3.3 知識問答質量體系
搭建流程 133
4.4 本章小結 142
第5章 標簽體系構建 143
5.1 標簽體系 143
5.1.1 標簽體系的重要性 143
5.1.2 標簽體系的分類 144
5.1.3 構建標簽體系 146
5.2 TF-IDF算法 151
5.2.1 TF-IDF算法介紹 151
5.2.2 TF-IDF算法實現 152
5.3 PageRank算法 155
5.4 TextRank算法 163
5.4.1 TextRank算法的使用
場景 164
5.4.2 TextRank算法的
優缺點 168
5.5 本章小結 168
第6章  文本摘要生成 169
6.1 文本摘要相關介紹 169
6.1.1 文本摘要問題定義 169
6.1.2 文本摘要分類 170
6.1.3 文本摘要的技術和方法 170
6.2 基于無監督的抽取式文本摘要 172
6.2.1 基于經驗的文本摘要 173
6.2.2 基于主題模型的
文本摘要 175
6.2.3 基于圖的文本摘要 182
6.2.4 基于特征評分的
文本摘要 185
6.2.5 基于聚類的文本摘要 188
6.3 基于有監督的抽取式文本摘要 191
6.4 基于深度神經網絡的生成式
文本摘要 201
6.5 文本摘要常用數據集 210
6.6 文本摘要評價方法 211
6.6.1 自動評價方法 211
6.6.2 人工評價方法 213
6.7 本章小結 213
第7章 文本糾錯 214
7.1 錯誤來源及類型 214
7.2 文本糾錯的3種傳統方法 215
7.2.1 模板匹配 215
7.2.2 編輯距離匹配 216
7.2.3 HANSpeller++框架 217
7.3 文本糾錯深度學習方法 220
7.3.1 英文文本糾錯方法 220
7.3.2 中文文本糾錯方法 224
7.4 工業界解決方法 233
7.4.1 3階段級聯的糾錯方案 234
7.4.2 符合多種場景的通用
糾錯方案 236
7.4.3 保險文本的糾錯方案 237
7.5 文本糾錯工具 239
7.5.1 pycorrector 239
7.5.2 xmnlp 240
7.6 本章小結 242

展開全部

基于NLP的內容理解 作者簡介

李明琦 資深AI技術專家,現就職于BAT,擔任高級算法工程師。長期致力于機器學習、深度學習、NLP等技術在實際業務場景中的落地,在內容理解方面有豐富的經驗,主導的內容質量項目曾獲得最佳項目獎。 先后發表人工智能相關的學術論文2篇,申請人工智能領域的發明專利5項。在GitHub上貢獻了大量內容質量、問答系統、NLP等方面的代碼,在CSDN撰寫了一些與算法、機器學習、內容理解相關的文章,深受歡迎。 谷 雪 現為葡萄牙米尼奧大學博士生,涉及的研究領域為神經架構搜索、自然語言處理、情感分析,博士期間著力于細粒度情感原因提取。先后發表過學術論文2篇,其中一篇是神經架構搜索的綜述,另一篇是基于進化策略的神經架構演化方法。在GitHub上貢獻了大量深度學習、機器學習代碼,在CSDN上分享了服務器配置、數據分析、圖像去噪、情感分析等方向的多篇文章。 孟子堯 在人工智能技術領域有非常深厚的積累,擅長機器學習和深度學習,尤其是深度學習中的圖像分類和自然語言處理等技術。熱衷于開源的應用和推廣,在GitHub和CSDN上貢獻了許多代碼和文章。在《計算機研究與發展》上發表過1篇人工智能相關論文。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 中医治疗皮肤病_潍坊银康医院「山东」重症皮肤病救治平台 | 数显恒温培养摇床-卧式/台式恒温培养摇床|朗越仪器 | 物流公司电话|附近物流公司电话上门取货| 飞利浦LED体育场灯具-吸顶式油站灯-飞利浦LED罩棚灯-佛山嘉耀照明有限公司 | 酒糟烘干机-豆渣烘干机-薯渣烘干机-糟渣烘干设备厂家-焦作市真节能环保设备科技有限公司 | 东莞办公家具厂家直销-美鑫【免费3D效果图】全国办公桌/会议桌定制 | 膜结构车棚|上海膜结构车棚|上海车棚厂家|上海膜结构公司 | 胀套-锁紧盘-风电锁紧盘-蛇形联轴器「厂家」-瑞安市宝德隆机械配件有限公司 | 送料机_高速冲床送料机_NC伺服滚轮送料机厂家-东莞市久谐自动化设备有限公司 | 振动筛,震动筛,圆形振动筛,振动筛价格,振动筛厂家-新乡巨宝机电 蒸汽热收缩机_蒸汽发生器_塑封机_包膜机_封切收缩机_热收缩包装机_真空机_全自动打包机_捆扎机_封箱机-东莞市中堡智能科技有限公司 | 中药超微粉碎机(中药细胞级微粉碎)-百科 | 热处理温控箱,热处理控制箱厂家-吴江市兴达电热设备厂 | 上海刑事律师|刑事辩护律师|专业刑事犯罪辩护律师免费咨询-[尤辰荣]金牌上海刑事律师团队 | 连续油炸机,全自动油炸机,花生米油炸机-烟台茂源食品机械制造有限公司 | 打包钢带,铁皮打包带,烤蓝打包带-高密市金和金属制品厂 | 123悬赏网_发布悬赏任务_广告任务平台| 杭州|上海贴标机-百科| 北京晚会活动策划|北京节目录制后期剪辑|北京演播厅出租租赁-北京龙视星光文化传媒有限公司 | 东莞螺丝|东莞螺丝厂|东莞不锈钢螺丝|东莞组合螺丝|东莞精密螺丝厂家-东莞利浩五金专业紧固件厂家 | 合肥展厅设计-安徽展台设计-合肥展览公司-安徽奥美展览工程有限公司 | 粉末包装机-给袋式包装机-全自动包装机-颗粒-液体-食品-酱腌菜包装机生产线【润立机械】 | 多物理场仿真软件_电磁仿真软件_EDA多物理场仿真软件 - 裕兴木兰 | 气动隔膜泵-电动隔膜泵-循环热水泵-液下排污/螺杆/管道/化工泵「厂家」浙江绿邦 | 魔方网-培训咨询服务平台 | 新密高铝耐火砖,轻质保温砖价格,浇注料厂家直销-郑州荣盛窑炉耐火材料有限公司 | 机械加工_绞车配件_立式离心机_减速机-洛阳三永机械厂 | 阀门智能定位器_电液动执行器_气动执行机构-赫尔法流体技术(北京)有限公司 | 南京PVC快速门厂家南京快速卷帘门_南京pvc快速门_世界500强企业国内供应商_南京美高门业 | 厌氧反应器,IC厌氧反应器,厌氧三相分离器-山东创博环保科技有限公司 | 进口消泡剂-道康宁消泡剂-陶氏消泡剂-大洋消泡剂 | 沈飞防静电地板__机房地板-深圳市沈飞防静电设备有限公司 | 航空铝型材,7系铝型材挤压,硬质阳*氧化-余润铝制品 | LED太阳能中国结|发光红灯笼|灯杆造型灯|节日灯|太阳能灯笼|LED路灯杆装饰造型灯-北京中海轩光电 | 四川职高信息网-初高中、大专、职业技术学校招生信息网 | 帽子厂家_帽子工厂_帽子定做_义乌帽厂_帽厂_制帽厂_帽子厂_浙江高普制帽厂 | 考勤系统_考勤管理系统_网络考勤软件_政企|集团|工厂复杂考勤工时统计排班管理系统_天时考勤 | 上海租奔驰_上海租商务车_上海租车网-矢昂汽车服务公司 | 无线对讲-无线对讲系统解决方案-重庆畅博通信 | 聚合甘油__盐城市飞龙油脂有限公司 | 精密五金冲压件_深圳五金冲压厂_钣金加工厂_五金模具加工-诚瑞丰科技股份有限公司 | 鑫达滑石-辽宁鑫达滑石集团 |