-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
大規模元搜索引擎技術 版權信息
- ISBN:9787111556176
- 條形碼:9787111556176 ; 978-7-111-55617-6
- 裝幀:暫無
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
大規模元搜索引擎技術 本書特色
本書廣泛而深入地介紹了大規模元搜索引擎技術,詳細討論了大規模元搜索引擎的主要部件——搜索引擎選擇、搜索引擎加入和結果合并,重點關注部件的高度可擴展性和自動化解決方案。作為Web搜索的競爭技術,本書對大規模元搜索引擎技術的可行性進行了強有力的論證。本書可作為高等院校Web數據管理和信息檢索等Web技術相關課程的教材,也可作為Web搜索領域的研究人員的參考書。
大規模元搜索引擎技術 內容簡介
本書廣泛而深入地介紹了大規模元搜索引擎技術,詳細討論了大規模元搜索引擎的主要部件——搜索引擎選擇、搜索引擎加入和結果合并,重點關注部件的高度可擴展性和自動化解決方案。作為Web搜索的競爭技術,本書對大規模元搜索引擎技術的可行性進行了強有力的論證。本書可作為高等院校Web數據管理和信息檢索等Web技術相關課程的教材,也可作為Web搜索領域的研究人員的參考書。
大規模元搜索引擎技術 目錄
譯者序
前 言
作者簡介
第1章 緒言 1
1.1 Web上查找信息 3
1.1.1 瀏覽 3
1.1.2 搜索 4
1.2 文本檢索概述 7
1.2.1 系統體系結構 7
1.2.2 文檔表示 8
1.2.3 文檔-查詢匹配 9
1.2.4 查詢處理 11
1.2.5 檢索有效性度量 13
1.3 搜索引擎技術概述 14
1.3.1 Web的專門特性 14
1.3.2 Web爬蟲 15
1.3.3 利用標簽信息 17
1.3.4 利用鏈接信息 18
1.3.5 結果組織 23
1.4 本書概述 25
第2章 元搜索引擎體系結構 27
2.1 系統體系結構 28
2.2 為什么使用元搜索引擎技術 33
2.3 挑戰環境 39
2.3.1 異構及其影響 40
2.3.2 規范化研究 43
第3章 搜索引擎選擇 47
3.1 粗糙表記方法 49
3.2 基于學習的方法 50
3.3 基于樣本文檔的方法 55
3.4 統計表記方法 59
3.4.1 D-WISE 59
3.4.2 CORINet 61
3.4.3 gGlOSS 63
3.4.4 潛在有用文檔數目 65
3.4.5 *相似文檔的相似度 68
3.4.6 搜索引擎表記生成 72
第4章 搜索引擎加入 77
4.1 搜索引擎連接 77
4.1.1 搜索引擎的HTML表單標簽 78
4.1.2 搜索引擎自動連接 81
4.2 搜索結果抽取 86
4.2.1 半自動包裝器生成 88
4.2.2 自動包裝器生成 93
第5章 結果合并 108
5.1 基于完全文檔內容的合并 111
5.2 基于搜索結果記錄的合并 113
5.3 基于結果本地排序的合并 119
5.3.1 基于輪轉的方法 120
5.3.2 基于相似度轉換的方法 121
5.3.3 基于投票的方法 124
5.3.4 基于機器學習的方法 130
第6章 總結與后續研究 132
參考文獻 136
大規模元搜索引擎技術 作者簡介
Weiyi Meng(孟衛一) 紐約州立大學賓漢姆頓分校計算機系教授,數據庫實驗室主席,IEEE ICTA國際會議程序委員會主席,美國元搜索引擎公司Webscalers創始人之一。孟衛一教授在互聯網信息檢索特別是元數據搜索引擎方面是國際公認的權威,取得多項研究成果并開發出可用的系統,現為人民大學客座教授。
Clement T. Yu 伊利諾伊大學芝加哥分校計算機科學教授。研究方向包括多媒體信息檢索、元搜索引擎、數據管理等。
- >
姑媽的寶刀
- >
李白與唐代文化
- >
羅庸西南聯大授課錄
- >
經典常談
- >
隨園食單
- >
自卑與超越
- >
龍榆生:詞曲概論/大家小書
- >
名家帶你讀魯迅:故事新編