中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
信息檢索系統導論

包郵 信息檢索系統導論

作者:劉挺
出版社:機械工業出版社出版時間:2008-12-01
所屬叢書: 重點大學計算機教材
開本: 16開 頁數: 257
本類榜單:社會科學銷量榜
中 圖 價:¥26.3(7.5折) 定價  ¥35.0 登錄后可看到會員價
暫時缺貨 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

信息檢索系統導論 版權信息

信息檢索系統導論 本書特色

隨著互聯網搜索引擎取得商業上的巨大成功,越來越多的讀者對信息檢索技術產生了濃厚的興趣。本書作者基于多年信息檢索教學與科研實踐心得編寫了本書,從基礎到應用,從理論到實踐,從經典算法到*新的研究成果,全面地介紹信息檢索系統中的各項核心技術。書中詳細闡述信息檢索模型、常用的文本操作技術、文本的索引和搜索技術、查詢處理相關的技術、評測技術等,有利于讀者了解信息檢索系統的基本實現原理,掌握搜索引擎的關鍵技術。
本書特點
理論聯系實際,介紹了用Lucene實現Web信息檢索的實例。
融入了作者的科研實踐心得,對相關的前沿技術也有所涉及。
每章后都附有大量的參考文獻,并提供思考題供讀者進行深入研究。
本書為授課教師提供電子課件,請登錄華章網站下載。

信息檢索系統導論 內容簡介

本書對信息檢索及信息檢索系統的基本概念、原理、算法進行詳盡介紹。主要內容包括信息檢索模型、文本操作技術、文本索引和搜索技術、查詢處理與Web檢索技術、分布式信息檢索、文本分類與聚類、信息過濾等,并給出Web信息檢索的實現實例。
本書內容豐富,源于作者多年的教學及科研心得,適合作為高等院校計算機專業本科生及研究生相關課程的教材,也可作為技術人員研究信息檢索與搜索引擎的參考讀物。

信息檢索系統導論 目錄


前言
作者簡介
教學建議
第1章 緒論
1.1 信息檢索簡介
1.1.1 信息檢索的概念和處理對象
1.1.2 信息檢索的基本流程
1.1.3 與信息檢索相關的學科
1.2 信息檢索的研究內容
1.2.1 信息檢索要解決的問題
1.2.2 信息檢索中的基礎研究課題
1.2.3 信息檢索中的關鍵技術
1.2.4 信息檢索中的應用研究
1.3 信息檢索的歷史、現狀與未來
1.3.1 信息檢索的歷史
1.3.2 信息檢索的現狀與未來
1.4 本書結構
本章小結
思考練習
第2章 信息檢索模型
2.1 信息檢索模型的定義和分類
2.1.1 信息檢索模型的定義
2.1.2 信息檢索模型的分類
2.2 布爾模型
2.2.1 布爾模型的定義
2.2.2 布爾模型示例
2.3 向量空間模型
2.3.1 向量空間模型的定義
2.3.2 常見相似度計算方法
2.3.3 向量空間模型與布爾模型的比較
2.4 概率模型
2.4.1 概率模型的定義
2.4.2 概率模型的優缺點
2.5 擴展布爾模型
2.5.1 擴展布爾模型簡介
2.5.2 基本模糊集合模型
2.5.3 擴展模糊集合模型
2.6 統計語言模型
2.6.1 語言模型簡介
2.6.2 數據稀疏和平滑
2.6.3 基于語言模型的檢索模型
2.6.4 基于語言模型的信息檢索模型的優缺點分析
2.7 隱性語義索引模型
2.7.1 隱性語義索引
2.7.2 隱性語義索引模型原理
2.7.3 隱性語義索引實例
2.7.4 隱性語義索引模型的特點
2.8 基于本體論的模型
2.8.1 本體論的概念
2.8.2 描述本體的語言
2.8.3 本體的構造
2.8.4 常用的本體庫簡介
2.8.5 本體論在信息檢索系統中的應用
本章小結
思考練習
參考文獻
第3章 信息檢索系統的評價
3.1 引言
3.2 性能評價指標
3.2.1 準確率和召回率
3.2.2 單值評價方法
3.2.3 一些特殊的評價方法
3.2.4 其他測度方法
3.3 國外信息檢索評測
3.3.1 TREC評測
3.3.2 NTCIR評測
3.3.3 CLEF評測
3.4 國內信息檢索評測
3.4.1 863信息檢索評測
3.4.2 SEWM中文Web評測
3.5 信息檢索評價的研究
3.5.1 現有研究成果介紹
3.5.2 今后的研究問題與趨勢
本章小結
思考練習
參考文獻
第4章 文本操作技術
4.1 引言
4.2 英文詞法分析
4.2.1 斷詞
4.2.2 詞干提取
4.3 中文詞法分析
4.3.1 *大匹配法
4.3.2 歧義詞切分
4.3.3 未登錄詞識別
4.3.4 分詞系統介紹
4.3.5 語料及評測
4.4 相關資源
4.4.1 停用詞表
4.4.2 詞典資源
4.5 英文拼寫檢查
4.5.1 形態還原
4.5.2 詞語相似度計算
本章小結
思考練習
參考文獻
第5章 文本索引和搜索
5.1 引言
5.2 倒排文件
5.2.1 倒排文件簡介
5.2.2 倒排文件的使用
5.2.3 倒排文件的建立
5.2.4 倒排文件的維護
5.2.5 倒排文件的壓縮
5.2.6 倒排文件性能分析
5.3 詞匯表的存取
5.3.1 排序數組
5.3.2 B樹
5.3.3 Trie樹
5.4 后綴數組
5.4.1 后綴數組的構造
5.4.2 后綴數組的使用
5.4.3 后綴數組的分析
5.5 簽名文件
5.5.1 簽名文件的構造
5.5.2 簽名文件的使用和維護
5.5.3 簽名文件的分析
5.6 文本搜索技術
5.6.1 BF算法
5.6.2 KMP算法
5.6.3 BM算法
5.6.4 精確模式匹配算法的選擇
本章小結
思考練習
參考文獻
第6章 查詢處理技術
6.1 引言
6.2 查詢構造方法
6.2.1 單一詞查詢
6.2.2 上下文查詢
6.2.3 布爾查詢
6.3 相關反饋與查詢重構
6.3.1 向量空間模型中的反饋與查詢重構
6.3.2 概率模型中的反饋與查詢重構
6.3.3 布爾模型中的反饋與查詢重構
6.3.4 相關反饋的評價
6.4 自動查詢擴展技術
6.4.1 查詢擴展的全局分析方法
6.4.2 查詢擴展的局部分析方法
6.4.3 基于詞典庫的查詢擴展
6.5 交互式查詢擴展
6.6 查詢處理的發展趨勢
本章小結
思考練習
參考文獻
第7章 Web檢索技術
7.1 引言
7.2 Web檢索的工作流程及系統結構
7.2.1 工作流程
7.2.2 系統結構
7.3 Web數據的采集
7.3.1 Web數據采集系統的工作原理
7.3.2 Web數據采集系統的相關概念及協議
7.3.3 Web數據采集系統的基本結構
7.3.4 Web數據采集系統的分類
7.4 網頁的預處理
7.4.1 網頁去重
7.4.2 正文提取
7.5 相關性排序系統
7.5.1 早期的相關性排序技術
7.5.2 鏈接分析技術
7.5.3 多特征融合的相關性排序算法
7.6 Web檢索系統的其他模塊
本章小結
思考練習
參考文獻
第8章 分布式信息檢索
8.1 引言
8.2 分布式信息檢索系統體系結構
8.3 文檔集合的劃分
8.4 文檔集合的選擇
8.4.1 文檔集合的表示
8.4.2 集合選擇算法
8.4.3 文檔集合選擇算法的評價
8.5 檢索結果的合并
本章小結
思考練習
參考文獻
第9章 Web信息檢索實踐
9.1 引言
9.2 利用Lucene建立索引
9.2.1 在Lucene中建立索引的主要步驟
9.2.2 基本索引程序
9.2.3 深入控制Lucene索引過程
9.2.4 與索引相關的并發問題
9.3 利用Lucene進行搜索
9.3.1 IndexSearcher
9.3.2 Hits
9.3.3 Query與QueryParser
本章小結
思考練習
參考資源
第10章 文本分類與聚類
10.1 引言
10.2 文本分類
10.2.1 文本分類概述
10.2.2 文本分類的過程
10.2.3 分類算法
10.2.4 文本分類的評估指標
10.2.5 相關評測和相關資源
10.3 文本聚類
10.3.1 文本聚類概述
10.3.2 層次聚類
10.3.3 基于劃分的聚類
10.3.4 基于密度的方法
10.3.5 自組織映射
10.3.6 基于模型的方法
10.3.7 文本聚類結果的描述
11.3.8 文本聚類的評價方法
本章小結
思考練習
參考文獻
第11章 信息過濾技術
11.1 引言
11.2 信息過濾的概念及主要研究內容
11.2.1 信息過濾的概念和主要特點
11.2.2 信息過濾與信息檢索、信息抽取以及分類等研究的區別
11.2.3 信息過濾系統的分類體系
11.3 信息過濾系統的結構及評價
11.3.1 信息過濾系統的組成
11.3.2 信息過濾系統的評價
11.4 基于內容的信息過濾
11.4.1 信息過濾中應用的統計模型
11.4.2 信息過濾中應用的文本分類方法
11.5 協作過濾
11.5.1 基于用戶的協作過濾
11.5.2 基于模型的協作過濾
11.5.3 基于項目的協作過濾
本章小結
思考練習
參考文獻
第12章 問答系統
12.1 引言
12.2 問答系統的發展歷程
12.3 問答系統的種類
12.3.1 問答系統分類方法
12.3.2 自然語言的數據庫問答系統
12.3.3 對話式問答系統
12.3.4 基于常問問題集的問答系統
12.3.5 基于大規模文檔集的問答系統
12.3.6 閱讀理解系統
12.3.7 基于知識庫的問答系統
12.4 基于常問問題集的問答系統實現
12.4.1 候選問題集的建立
12.4.2 句子相似度計算
12.5 基于大規模文檔集的問答系統實現
12.5.1 問答的任務與系統實現流程
12.5.2 問題分析
12.5.3 相關文檔檢索
12.5.4 句段檢索
12.5.5 答案抽取
12.5.6 問答結果的答案評測及其面對的問題和困難
本章小結
思考練習
參考文獻
展開全部

信息檢索系統導論 節選

第1章 緒論
1.1 信息檢索簡介
1.1.1 信息檢索的概念和處理對象
什么是信息檢索呢?概括地說,信息檢索就是從非結構化的信息集合中找出與用戶需求相關的信息。相應的,信息檢索系統就是用來實現信息檢索功能的計算機軟件系統。
這里要強調的是,與數據庫系統處理的結構化信息不同,信息檢索系統處理的是“非結構化信息”。什么是“非結構化信息”呢?一篇新聞就是一條非結構化信息,新聞中會出現一些人名、地名、機構名等實體,以及這些實體之間的關系(比如某人是某地區某機關的負責人),還有與這些實體相關的事件(比如某人訪問了某地)。但是這些人、事、物、關系和事件并不像關系數據庫的二維表中存放的信息那樣,被精確地分割并嚴格地存放在合適的字段或記錄中。這種在現實世界中自然存在的模糊而帶有歧義且沒有經過規格化的信息被稱為“非結構化的”(unstructured)信息。
現實世界中存在著大量的非結構化信息,除文本外,還有圖像、圖形、語音、視頻等多媒體信息。本書不討論多媒體檢索,而是專注于文本檢索,因此本書中所涉及的檢索對象默認為文本。文本又有各種各樣的類型,如網頁、郵件、博客、論壇上的帖子、聊天記錄、短信等,不同類型的文本有不同的特點,比如論壇上的帖子往往非常口語化,存在大量的別稱、省略語等現象,給檢索帶來很大的挑戰。
……

信息檢索系統導論 作者簡介

劉挺,教授,博士生導師。哈爾濱工業大學計算機研究所副所長,信息檢索研究室主任。國家863”中文處理”重點項目總體組專家。中國中文信息學會理事.信息檢索專委會副主任.計算語言學專委會委員,《中文信息學報》編委。中國計算機學會中文信息技術專委會委員,YOCSEF委員。曾任IJCNLP、AIRS等國際會議的程序委員會委員,以及全國信息檢索會議NCIRCS的程序委貫會主席,JSCL的多屬委員等。主要研究方向為信息檢索和自然語言處理,主持多項國家、部委、國際金作、企業合作等科研項目.在相關領域發表論文60余篇。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 河南膏药贴牌-膏药代加工-膏药oem厂家-洛阳今世康医药科技有限公司 | 磁力加热搅拌器-多工位|大功率|数显恒温磁力搅拌器-司乐仪器官网 | 技德应用| 标准件-非标紧固件-不锈钢螺栓-非标不锈钢螺丝-非标螺母厂家-三角牙锁紧自攻-南京宝宇标准件有限公司 | 长沙一级消防工程公司_智能化弱电_机电安装_亮化工程专业施工承包_湖南公共安全工程有限公司 | 有福网(yofus.com)洗照片冲印,毕业聚会纪念册相册制作个性DIY平台 | 精密机械零件加工_CNC加工_精密加工_数控车床加工_精密机械加工_机械零部件加工厂 | 铝镁锰板_铝镁锰合金板_铝镁锰板厂家_铝镁锰金属屋面板_安徽建科 | 陶氏道康宁消泡剂_瓦克消泡剂_蓝星_海明斯德谦_广百进口消泡剂 | 活性炭厂家-蜂窝活性炭-粉状/柱状/果壳/椰壳活性炭-大千净化-活性炭 | 万家财经_财经新闻_在线财经资讯网 | 网站建设,北京网站建设,北京网站建设公司,网站系统开发,北京网站制作公司,响应式网站,做网站公司,海淀做网站,朝阳做网站,昌平做网站,建站公司 | 安平县鑫川金属丝网制品有限公司,声屏障,高速声屏障,百叶孔声屏障,大弧形声屏障,凹凸穿孔声屏障,铁路声屏障,顶部弧形声屏障,玻璃钢吸音板 | 衬塑管道_衬四氟管道厂家-淄博恒固化工设备有限公司 | RTO换向阀_VOC高温阀门_加热炉切断阀_双偏心软密封蝶阀_煤气蝶阀_提升阀-湖北霍科德阀门有限公司 | 齿轮减速电机一体机_蜗轮蜗杆减速马达-德国BOSERL齿轮减速机带电机生产厂家 | 热镀锌槽钢|角钢|工字钢|圆钢|H型钢|扁钢|花纹板-天津千百顺钢铁贸易有限公司 | 头条搜索极速版下载安装免费新版,头条搜索极速版邀请码怎么填写? - 欧远全 | 净化车间_洁净厂房_净化公司_净化厂房_无尘室工程_洁净工程装修|改造|施工-深圳净化公司 | 真空干燥烘箱_鼓风干燥箱 _高低温恒温恒湿试验箱_光照二氧化碳恒温培养箱-上海航佩仪器 | 玉米加工设备,玉米深加工机械,玉米糁加工设备.玉米脱皮制糁机 华豫万通粮机 | 除甲醛公司-甲醛检测治理-杭州创绿家环保科技有限公司-室内空气净化十大品牌 | 电动葫芦|手拉葫芦|环链电动葫芦|微型电动葫芦-北京市凌鹰起重机械有限公司 | 尚为传动-专业高精密蜗轮蜗杆,双导程蜗轮蜗杆,蜗轮蜗杆减速机,蜗杆减速机生产厂家 | 工业CT-无锡璟能智能仪器有限公司| 净化车间装修_合肥厂房无尘室设计_合肥工厂洁净工程装修公司-安徽盛世和居装饰 | 南京兰江泵业有限公司-水解酸化池潜水搅拌机-絮凝反应池搅拌机-好氧区潜水推进器 | 辐射仪|辐射检测仪|辐射巡测仪|个人剂量报警仪|表面污染检测仪|辐射报警仪|辐射防护网 | Eiafans.com_环评爱好者 环评网|环评论坛|环评报告公示网|竣工环保验收公示网|环保验收报告公示网|环保自主验收公示|环评公示网|环保公示网|注册环评工程师|环境影响评价|环评师|规划环评|环评报告|环评考试网|环评论坛 - Powered by Discuz! | 菲希尔FISCHER测厚仪-铁素体检测仪-上海吉馨实业发展有限公司 | 冷轧机|两肋冷轧机|扁钢冷轧机|倒立式拉丝机|钢筋拔丝机|收线机-巩义市华瑞重工机械制造有限公司 | 合肥汽车充电桩_安徽充电桩_电动交流充电桩厂家_安徽科帝新能源科技有限公司 | 好物生环保网、环保论坛 - 环保人的学习交流平台 | 电镀电源整流器_高频电解电源_单脉双脉冲电源 - 东阳市旭东电子科技 | ★济南领跃标识制作公司★济南标识制作,标牌制作,山东标识制作,济南标牌厂 | 飞歌臭氧发生器厂家_水处理臭氧发生器_十大臭氧消毒机品牌 | 蔬菜清洗机_环速洗菜机_异物去除清洗机_蔬菜清洗机_商用洗菜机 - 环速科技有限公司 | pbootcms网站模板|织梦模板|网站源码|jquery建站特效-html5模板网 | 安全,主动,被动,柔性,山体滑坡,sns,钢丝绳,边坡,防护网,护栏网,围栏,栏杆,栅栏,厂家 - 护栏网防护网生产厂家 | 七维官网-水性工业漆_轨道交通涂料_钢结构漆 | 安规_综合测试仪,电器安全性能综合测试仪,低压母线槽安规综合测试仪-青岛合众电子有限公司 |