中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
搜索引擎-信息檢索實踐

包郵 搜索引擎-信息檢索實踐

出版社:機械工業出版社出版時間:2010-06-01
所屬叢書: 計算機科學叢書
開本: 16開 頁數: 309
本類榜單:社會科學銷量榜
中 圖 價:¥30.8(5.5折) 定價  ¥56.0 登錄后可看到會員價
暫時缺貨 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

搜索引擎-信息檢索實踐 版權信息

  • ISBN:9787111288084
  • 條形碼:9787111288084 ; 978-7-111-28808-4
  • 裝幀:暫無
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>

搜索引擎-信息檢索實踐 內容簡介

本書介紹了信息檢索(ir)中的關鍵問題,以及這些問題如何影響搜索引擎的設計與實現,并且用數學模型強化了重要的概念。對于網絡搜素引擎這一重要的話題,書中主要涵蓋了在網絡上廣泛使用的搜索技術。
  本書適用于高等院校計算機科學或計算機工程專業的本科生、研究生,對于專業人士而言,本書也不失為一本理想的入門教材。

搜索引擎-信息檢索實踐 目錄

出版者的話
譯者序
前言
第1章 搜索引擎和信息檢索
 1.1 什么是信息檢索
 1.2 重要問題
 1.3 搜索引擎
 1.4 搜索工程師
 參考文獻和深入閱讀
 練習
第2章 搜索引擎的架構
 2.1 什么是軟件架構
 2.2 基本的構件
 2.3 組件及其功能
  2.3.1 文本采集
  2.3.2 文本轉換
  2.3.3 索引的創建
  2.3.4 用戶交互
  2.3.5 排序
  2.3.6 評價
 2.4 搜索引擎是如何工作的
 參考文獻和深入閱讀
 練習
第3章 信息采集和信息源
 3.1 確定搜索的內容
 3.2 網絡信息爬取
  3.2.1 抓取網頁
  3.2.2 網絡爬蟲
  3.2.3 時新性
  3.2.4 面向主題的信息采集
  3.2.5 深層網絡
  3.2.6 網站地圖
  3.2.7 分布式信息采集
 3.3 文檔和電子郵件的信息采集
 3.4 文檔信息源
 3.5 轉換問題
 3.6 存儲文檔
  3.6.1 使用數據庫系統
  3.6.2 隨機存取
  3.6.3 壓縮和大規模文件
  3.6.4 更新
   3.6.5 bigtable
 3.7 重復檢測
 3.8 去除噪聲
 參考文獻和深入閱讀
 練習
第4章 文本處理
 4.1 從詞到詞項
 4.2 文本統計
  4.2.1 詞表增長
  4.2.2 估計數據集和結果集大小
 4.3 文檔解析
  4.3.1 概述
  4.3.2 詞素切分
  4.3.3 停用詞去除
  4.3.4 詞干提取
  4.3.5 短語和n元串
 4.4 文檔結構和標記
  4.5 鏈接分析
  4.5.1 錨文本
  4.5.2 pagerank
  4.5.3 鏈接質量
 4.6 信息抽取
 4.7 國際化
 參考文獻和深入閱讀
 練習
第5章 基于索引的相關排序
 5.1 概述
 5.2 抽象的相關排序模型
 5.3 倒排索引
  5.3.1 文檔
  5.3.2 計數
  5.3.3 位置
  5.3.4 域與范圍
  5.3.5 分數
  5.3.6 排列
 5.4 壓縮
  5.4.1 熵與歧義
  5.4.2 delta編碼
  5.4.3 位對齊碼
  5.4.4 字節對齊碼
  5.4.5 實際應用中的壓縮
  5.4.6 展望
  5.4.7 跳轉和跳轉指針
 5.5 輔助結構
 5.6 索引構建
  5.6.1 簡單構建
  5.6.2 融合
  5.6.3 并行與分布式
  5.6.4 更新
 5.7 查詢處理
  5.7.1 document-at-a-time評價
  5.7.2 term-at-a-time評價
  5.7.3 優化技術
  5.7.4 結構化查詢
  5.7.5 分布式的評價
  5.7.6 緩存
 參考文獻和深入閱讀
 練習
第6章 查詢與界面
 6.1 信息需求與查詢
 6.2 查詢轉換與提煉
  6.2.1 停用詞去除和詞干提取
  6.2.2 拼寫檢查和建議
  6.2.3 查詢擴展
  6.2.4 相關反饋
  6.2.5 上下文和個性化
 6.3 搜索結果顯示
  6.3.1 搜索結果頁面與頁面摘要
  6.3.2 廣告與搜索
  6.3.3 結果聚類
 6.4 跨語言搜索
 參考文獻和深入閱讀
 練習
第7章 檢索模型
 7.1 檢索模型概述
  7.1.1 布爾檢索
  7.1.2 向量空間模型
 7.2 概率模型
  7.2.1 將信息檢索作為分類問題
  7.2.2 bm25排序算法
 7.3 基于排序的語言模型
  7.3.1 查詢項似然排序
  7.3.2 相關性模型和偽相關反饋
 7.4 復雜查詢和證據整合
  7.4.1 推理網絡模型
  7.4.2 galago查詢語言
 7.5 網絡搜索
 7.6 機器學習和信息檢索
  7.6.1 排序學習
  7.6.2 主題模型和詞匯不匹配
 7.7 基于應用的模型
 參考文獻和深入閱讀
 練習
第8章 搜索引擎評價
 8.1 搜索引擎評價的意義
 8.2 評價語料
 8.3 日志
 8.4 效果評價
  8.4.1 召回率和準確率
  8.4.2 平均化和插值
  8.4.3 關注排序靠前的文檔
  8.4.4 使用用戶偏好
 8.5 效率評價
 8.6 訓練、測試和統計
  8.6.1 顯著性檢驗
  8.6.2 設置參數值
  8.6.3 在線測試
 8.7 基本要點
 參考文獻和深入閱讀
 練習
第9章 分類和聚類
 9.1 分類
  9.1.1 樸素貝葉斯
  9.1.2 支持向量機
  9.1.3 評價
  9.1.4 分類器和特征選擇
  9.1.5 垃圾、情感及在線廣告
 9.2 聚類
  9.2.1 層次聚類和k均值聚類
  9.2.2 k近鄰聚類
  9.2.3 評價
  9.2.4 如何選擇k
  9.2.5 聚類和搜索
 參考文獻和深入閱讀
 練習
第10章 社會化搜索
 10.1 什么是社會化搜索
 10.2 用戶標簽和人工索引
  10.2.1 搜索標簽
  10.2.2 推測缺失的標簽
  10.2.3 瀏覽和標簽云
 10.3 社區內搜索
  10.3.1 什么是社區
  10.3.2 社區發現
  10.3.3 基于社區的問答
  10.3.4 協同搜索
 10.4 過濾和推薦
  10.4.1 文檔過濾
  10.4.2 協同過濾
 10.5 p2p搜索和元搜索
  10.5.1 分布式搜索
  10.5.2 p2p網絡
 參考文獻和深入閱讀
 練習
第11章 超越詞袋
 11.1 概述
 11.2 基于特征的檢索模型
 11.3 詞項依賴模型
 11.4 再談結構化
  11.4.1 xml檢索
  11.4.2 實體搜索
 11.5 問題越長,答案越好
 11.6 詞語、圖片和音樂
 11.7 搜索能否適用于所有情況
 參考文獻和深入閱讀
 練習
參考文獻
展開全部

搜索引擎-信息檢索實踐 節選

《搜索引擎:信息檢索實踐》介紹了信息檢索中的關鍵問題,以及這些問題如何影響搜索引擎的設計與實現,很好地兼顧了信息檢索理論以及搜索引擎的設計、實現和使用中的知識面廣度與深度問題,重點關注于那些對于實現搜索引擎組件以及組件背后的信息檢索模型*重要的部分,以及網絡上使用的搜索技術。《搜索引擎:信息檢索實踐》適合作為高等院校計算機科學或計算機工程專業本科生或研究生的教材。

搜索引擎-信息檢索實踐 相關資料

插圖:2.查詢轉換查詢轉換組件包括一系列的技術,這些技術用于在生成排好序的文檔之前和之后改善初始查詢。最簡單的處理涉及一些對文檔進行文本轉換的技術。在查詢文本上,需要進行詞素切分、停用詞去除和詞干提取這些工作,以生成與文檔詞項具有可比性的索引詞。拼寫檢查(spell checking)和查詢建議(query suggestion)是查詢轉換中的技術,生成與用戶初始查詢相似的輸出。在這兩種情況下,向用戶提供初始查詢的一些候選查詢,這些候選查詢可能糾正了拼寫錯誤或者是對用戶所需信息的更規范的描述。這些技術通常會導致為網絡應用搜集大量的查詢日志(query log)。查詢擴展(query expansion)技術是對查詢進行推薦或者增加一些額外的詞項,但通常都是在對文檔中詞項的出現情況分析的基礎上進行的。該分析通常是用不同的信息源,如整個文檔集合、檢索到的文檔或者用戶計算機上的文檔。相關反饋(relevance feedback)是一種查詢擴展技術,利用用戶認為相關的文檔中出現的詞項對查詢進行擴展。3.結果輸出結果輸出組件負責對相關組件得到的排好序的文檔的結果進行顯示。可能包含的任務有生成網頁摘要(snippets)來對檢索到的文檔內容進行概括;強調(highlighting)文檔中重要的詞和段落;對輸出結果聚類以找到文檔相關的類別;以及將相應的廣告增加到結果顯示中。在涉及多種語言的應用系統中,結果可能會被翻譯成同一種的語言。

搜索引擎-信息檢索實踐 作者簡介

作者:(美國)克羅夫特(W.Bruce Croft) (美國)Donald Metzler (美國)Trevor Strohman 譯者:劉挺 秦兵 張宇 等克羅夫特(W.Bruce Croft),馬薩諸塞大學阿默斯特分校計算機科學特聘教授、ACM會士。他創建了智能信息檢索研究中心,發表了200余篇論文,多次獲獎,其中包括2003年由ACM SIGIR頒發的Gerard Salton獎。Donald Metzler,馬薩諸塞大學阿默斯特分校博士,是位于加州Santa Clara的雅虎研究中心搜索與計算機廣告組的研究科學家。Trevor Strohman,馬薩諸塞大學阿默斯特分校博士。他開發了Galago搜索引擎,也是Indri搜索引擎的主要開發者。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 钢绞线万能材料试验机-全自动恒应力两用机-混凝土恒应力压力试验机-北京科达京威科技发展有限公司 | 上海logo设计 | BOE画框屏-触摸一体机-触控查询一体机-触摸屏一体机价格-厂家直销-触发电子 | 【甲方装饰】合肥工装公司-合肥装修设计公司,专业从事安徽办公室、店面、售楼部、餐饮店、厂房装修设计服务 | 仓储笼_仓储货架_南京货架_仓储货架厂家_南京货架价格低-南京一品仓储设备制造公司 | BOE画框屏-触摸一体机-触控查询一体机-触摸屏一体机价格-厂家直销-触发电子 | 北京易通慧公司从事北京网站优化,北京网络推广、网站建设一站式服务商-北京网站优化公司 | 上海心叶港澳台联考一对一培训_上海心叶港澳台联考,港澳台联考一对一升学指导 | 400电话_400电话申请_866元/年_【400电话官方业务办理】-俏号网 3dmax渲染-效果图渲染-影视动画渲染-北京快渲科技有限公司 | 真石漆,山东真石漆,真石漆厂家,真石漆价格-山东新佳涂料有限公司 | 长沙广告公司_制作,长沙喷绘_发光字_招牌制作_长沙泓润广告官网 长城人品牌官网 | 理化生实验室设备,吊装实验室设备,顶装实验室设备,实验室成套设备厂家,校园功能室设备,智慧书法教室方案 - 东莞市惠森教学设备有限公司 | 硬质合金模具_硬质合金非标定制_硬面加工「生产厂家」-西迪技术股份有限公司 | 胃口福饺子加盟官网_新鲜现包饺子云吞加盟 - 【胃口福唯一官网】 | 聚天冬氨酸,亚氨基二琥珀酸四钠,PASP,IDS - 远联化工 | 高清视频编码器,4K音视频编解码器,直播编码器,流媒体服务器,深圳海威视讯技术有限公司 | 课件导航网_ppt课件_课件模板_课件下载_最新课件资源分享发布平台 | 电解抛光加工_不锈钢电解抛光_常州安谱金属制品有限公司 | 焊缝跟踪系统_激光位移传感器_激光焊缝跟踪传感器-创想智控 | 清洁设备_洗地机/扫地机厂家_全自动洗地机_橙犀清洁设备官网 | 全钢实验台,实验室工作台厂家-无锡市辰之航装饰材料有限公司 | 陶氏道康宁消泡剂_瓦克消泡剂_蓝星_海明斯德谦_广百进口消泡剂 | 家用净水器代理批发加盟_净水机招商代理_全屋净水器定制品牌_【劳伦斯官网】 | 广州监控安装公司_远程监控_安防弱电工程_无线wifi覆盖_泉威安防科技 | 扫地车厂家-山西洗地机-太原电动扫地车「大同朔州吕梁晋中忻州长治晋城洗地机」山西锦力环保科技有限公司 | 上海办公室装修,办公楼装修设计,办公空间设计,企业展厅设计_写艺装饰公司 | 不锈钢螺丝 - 六角螺丝厂家 - 不锈钢紧固件 - 万千紧固件--紧固件一站式采购 | 水性漆|墙面漆|木器家具漆|水漆涂料_晨阳水漆官网 | 超声波清洗机-超声波清洗设备定制生产厂家 - 深圳市冠博科技实业有限公司 | 光谱仪_积分球_分布光度计_灯具检测生产厂家_杭州松朗光电【官网】 | 上海道勤塑化有限公司 | 深圳市八百通智能技术有限公司官方网站 | 超声波成孔成槽质量检测仪-压浆机-桥梁预应力智能张拉设备-上海硕冠检测设备有限公司 | 旋振筛_不锈钢旋振筛_气旋筛_旋振筛厂家—新乡市大汉振动机械有限公司 | 上海乾拓贸易有限公司-日本SMC电磁阀_德国FESTO电磁阀_德国FESTO气缸 | 工业铝型材生产厂家_铝合金型材配件批发精加工定制厂商 - 上海岐易铝业 | 瓶盖扭矩测试仪-瓶盖扭力仪-全自动扭矩仪-济南三泉中石单品站 | 德国BOSCH电磁阀-德国HERION电磁阀-JOUCOMATIC电磁阀|乾拓百科 | 微型气象仪_气象传感器_防爆气象传感器-天合传感器大全 | 单柱拉力机-橡胶冲片机-哑铃裁刀-江都轩宇试验机械厂 | 挨踢网-大家的导航!|