中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >>
使用C#開發搜索引擎-(第2版)

包郵 使用C#開發搜索引擎-(第2版)

作者:羅剛編著
出版社:清華大學出版社出版時間:2018-01-01
開本: 32開 頁數: 454
中 圖 價:¥26.8(3.9折) 定價  ¥68.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
溫馨提示:5折以下圖書主要為出版社尾貨,大部分為全新(有塑封/無塑封),個別圖書品相8-9成新、切口
有劃線標記、光盤等附件不全詳細品相說明>>
本類五星書更多>

使用C#開發搜索引擎-(第2版) 版權信息

  • ISBN:9787302484462
  • 條形碼:9787302484462 ; 978-7-302-48446-2
  • 裝幀:一般膠版紙
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>>

使用C#開發搜索引擎-(第2版) 本書特色

《使用C#開發搜索引擎(第2版)》介紹如何以C#作為工具開發智能搜索引擎系統。 《使用C#開發搜索引擎(第2版)》是一本介紹業界熱門的Lucene.Net、使用WebBrowser做爬蟲以及結合Solr/ElasticSearch開發ASP.NET搜索的書籍。書中從網絡爬蟲抓取數據開始;然后介紹中文分詞、文本排重等文本挖掘技術和搜索結果展現;*后介紹在線智能客服(聊天機器人)開發框架。從C#語法開始,逐漸深入,是零基礎實踐面向未來的智能軟件開發的*。 對于學習復雜數據結構和自然語言處理相關應用開發也有參考價值。

使用C#開發搜索引擎-(第2版) 內容簡介

《使用C#開發搜索引擎(第2版)》是介紹業界熱門的Lucene.Net、使用WebBrowser做爬蟲以及結合Solr/ElasticSearch開發ASP.NET搜索的書籍!妒褂肅#開發搜索引擎(第2版)》還介紹了在線智能客服(聊天機器人)開發框架。從C#語法開始,逐漸深入,是零基礎實踐面向未來的智能軟件開發的不二之選。對于學習復雜數據結構和自然語言處理相關應用開發也有參考價值。

使用C#開發搜索引擎-(第2版) 目錄

目 錄 第1章 使用C#開發搜索引擎 快速入門 1 1.1 各種搜索引擎 2 1.1.1 通用搜索 3 1.1.2 垂直搜索 3 1.1.3 站內搜索 4 1.2 搜索引擎的整體結構 4 1.3 搜索引擎的基本技術 5 1.3.1 網絡爬蟲 5 1.3.2 文本挖掘 5 1.3.3 全文索引 6 1.3.4 搜索語法介紹 8 1.3.5 搜索用戶界面 8 1.4 C#開發快速入門 9 1.4.1 準備開發環境 9 1.4.2 基本語法 9 1.4.3 多維數組 11 1.4.4 位運算 11 1.4.5 枚舉類型 12 1.4.6 面向對象 13 1.4.7 字符串 15 1.4.8 讀寫文件 16 1.4.9 集合類 17 1.4.10 泛型 20 1.4.11 委托和事件 21 1.4.12 lambda表達式 24 1.4.13 單元測試 24 1.4.14 擴展方法 25 1.4.15 類庫 26 1.5 算法基礎 26 1.5.1 雙端隊列 27 1.5.2 散列表 31 1.5.3 單鏈表 36 1.5.4 標準Trie樹 37 1.5.5 二叉搜索樹 39 1.5.6 三叉Trie樹 41 1.5.7 平衡Trie樹 46 1.6 本章小結 48 1.7 術語表 48 第2章 使用C#開發網絡爬蟲 51 2.1 網絡爬蟲抓取原理 52 2.2 爬蟲架構 54 2.2.1 基本架構 54 2.2.2 分布式爬蟲架構 56 2.2.3 垂直爬蟲架構 57 2.3 下載網頁 58 2.3.1 HTTP協議 58 2.3.2 下載靜態網頁 61 2.3.3 下載動態網頁 65 2.4 線程池 73 2.5 網絡爬蟲的遍歷與實現 75 2.6 網站地圖 77 2.7 連接池 78 2.8 URL地址查新 79 2.8.1 嵌入式數據庫 79 2.8.2 布隆過濾器 82 2.9 抓取RSS 84 2.10 解析相對地址 86 2.11 網頁更新 86 2.12 信息過濾 89 2.13 垂直行業抓取 94 2.14 抓取限制應對方法 94 2.14.1 更換IP地址 94 2.14.2 抓取需要登錄的網頁 98 2.14.3 抓取ASP.net網頁 100 2.15 保存信息 103 2.15.1 存入數據庫 103 2.15.2 存成圖像 104 2.16 日志 105 2.17 本章小結 108 2.18 術語表 108 第3章 索引各種格式文檔 113 3.1 從HTML文件中提取信息 114 3.1.1 識別網頁的編碼 114 3.1.2 正則表達式 116 3.1.3 Html Agility Pack介紹 120 3.1.4 NSoup介紹 124 3.1.5 網頁正文提取 124 3.1.6 結構化信息提取 137 3.1.7 查看網頁的DOM結構 140 3.1.8 網頁結構相似度計算 141 3.2 從非HTML文件中提取文本 143 3.2.1 TEXT文件 144 3.2.2 PDF文件 144 3.2.3 Office文件 146 3.2.4 Rtf文件 147 3.3 OCR 148 3.3.1 字形識別 149 3.3.2 圖像二值化 149 3.4 本章小結 153 3.5 術語表 154 第4章 自然語言處理 155 4.1 統計機器學習 156 4.2 協同推薦 157 4.3 文檔排重 163 4.3.1 生成SimHash 164 4.3.2 查找SimHash 166 4.3.3 用于短文本排重 170 4.4 中文關鍵詞提取 170 4.4.1 關鍵詞提取的基本方法 171 4.4.2 從網頁中提取關鍵詞 174 4.5 相關搜索 174 4.6 拼寫檢查 175 4.6.1 拼寫檢查的概率模型 176 4.6.2 模糊匹配問題 176 4.6.3 英文拼寫檢查 180 4.6.4 中文拼寫檢查 183 4.7 文本摘要 184 4.7.1 文本摘要的設計 184 4.7.2 實現文本摘要技術 185 4.7.3 Lucene.net中的動態摘要 190 4.8 文本分類 191 4.8.1 自動分類的接口定義 191 4.8.2 自動分類的實現 191 4.9 自動聚類 197 4.9.1 文檔相似度 197 4.9.2 K均值聚類方法 201 4.9.3 K均值實現 202 4.10 拼音轉換 204 4.11 句法分析樹 204 4.12 信息提取 211 4.12.1 信息提取的規則及其實現 211 4.12.2 提取地域信息 219 4.13 本章小結 221 4.14 術語表 221 第5章 用C#實現中文分詞 223 5.1 詞 224 5.2 文本切分的基本方法 224 5.3 地名切分 226 5.3.1 地址類型標注 227 5.3.2 未登錄詞識別 227 5.4 有限狀態機 229 5.5 查找詞典算法 231 5.6 中文分詞的原理 232 5.6.1 正向*大長度匹配法 232 5.6.2 逆向*大長度匹配法 236 5.6.3 處理未登錄串 240 5.7 中文分詞的流程與結構 241 5.8 切分詞圖 243 5.8.1 保存切分詞圖 243 5.8.2 生成全切分詞圖 247 5.9 概率語言模型的分詞方法 250 5.9.1 準備數據 251 5.9.2 一元模型 252 5.9.3 N元模型 257 5.10 *大熵 262 5.11 未登錄詞識別 264 5.12 詞性標注 264 5.12.1 隱馬爾科夫模型 266 5.12.2 實現詞性標注 271 5.13 本章小結 275 5.14 術語表 276 第6章 Lucene.net原理與應用 277 6.1 Lucene.net快速入門 278 6.1.1 索引文檔 278 6.1.2 搜索文檔 280 6.1.3 Lucene.net結構 281 6.2 Lucene.net深入介紹 282 6.2.1 索引原理 282 6.2.2 分析文本 285 6.2.3 遍歷索引庫 288 6.2.4 布爾查詢原理 289 6.2.5 檢索模型 290 6.2.6 收集*相關的文檔 291 6.3 索引中的壓縮算法 296 6.3.1 變長壓縮 296 6.3.2 差分編碼 298 6.4 創建和維護索引庫 299 6.4.1 設計一個簡單的索引庫 299 6.4.2 創建索引庫 300 6.4.3 向索引庫中添加索引文檔 301 6.4.4 刪除索引庫中的索引文檔 303 6.4.5 更新索引庫中的索引文檔 304 6.4.6 索引的優化與合并 304 6.5 查找索引庫 305 6.5.1 布爾查詢 306 6.5.2 同時查詢多列 307 6.5.3 跨度查詢 308 6.5.4 通配符查詢 312 6.5.5 過濾 312 6.5.6 按指定列排序 313 6.5.7 查詢大容量索引 318 6.5.8 函數查詢 320 6.5.9 定制相似度 323 6.5.10 評價搜索結果 325 6.6 中文信息檢索 325 6.6.1 Lucene.net中的中文處理 326 6.6.2 Lietu中文分詞的使用 326 6.6.3 定制Tokenizer 328 6.6.4 解析查詢串 329 6.6.5 實現字詞混合索引 333 6.7 抓取數據庫中的內容 336 6.7.1 讀取數據 337 6.7.2 數據同步 338 6.8 與爬蟲集成 338 6.9 概念搜索 341 6.10 本章小結 344 6.11 術語表 345 第7章 實現搜索用戶界面 347 7.1 搜索頁面設計 348 7.1.1 用于顯示搜索結果的 ASP.net 348 7.1.2 搜索結果條 351 7.1.3 搜索結果分頁 351 7.1.4 設計一個簡單的搜索頁面 352 7.2 實現搜索接口 353 7.2.1 Lucene.net搜索接口 353 7.2.2 指定范圍搜索 357 7.2.3 搜索頁面的索引緩存與 更新 358 7.3 實現關鍵詞高亮顯示 361 7.4 實現分類統計視圖 362 7.4.1 搜索結果分類統計與導航 363 7.4.2 層次樹 366 7.5 相關搜索詞 368 7.6 實現AJax自動完成 369 7.6.1 總體結構 370 7.6.2 服務器端處理 371 7.6.3 瀏覽器端處理 372 7.7 集成其他功能 374 7.7.1 拼寫檢查 374 7.7.2 再次查找 374 7.7.3 黑名單 375 7.7.4 搜索日志 376 7.8 本章小結 377 第8章 使用Solr開發網站搜索 379 8.1 搜索服務器端 380 8.1.1 Solr的結構 380 8.1.2 啟動Solr服務器 381 8.1.3 開發支持Solr的中文分詞 384 8.1.4 中文的Solr 385 8.1.5 索引數據 388 8.1.6 查詢功能 389 8.1.7 高亮顯示 392 8.2 Solr的.NET客戶端 393 8.2.1 使用Solrnet 393 8.2.2 查詢 396 8.2.3 分類統計 397 8.2.4 ASP.NET中使用Solrnet 401 8.2.5 刪除數據 405 8.2.6 從數據庫索引數據 405 8.2.7 翻頁 408 8.2.8 實現多分類 411 8.3 查詢語法 412 8.3.1 對空格的支持 413 8.3.2 日期加權 413 8.4 索引分布 415 8.5 本章小結 417 第9章 Elasticsearch開發分 布式搜索 419 9.1 搜索集群 421 9.2 安裝 422 9.3 ES的.net客戶端 429 9.3.1 連接搜索服務器 429 9.3.2 創建索引 430 9.3.3 插入數據 431 9.4 查詢 432 9.4.1 布爾查詢 433 9.4.2 嵌套類型和嵌套查詢 434 9.4.3 查詢結果 437 9.4.4 過濾器 437 9.5 高亮顯示 437 9.6 分頁 442 9.7 本章小結 442 第10章 在線客服案例分析 445 10.1 使用WebSocket 446 10.2 知識庫 447 10.3 自動問答 449 10.4 本章小結 453 參考資源 455
展開全部

使用C#開發搜索引擎-(第2版) 作者簡介

羅剛,計算機軟件碩士,畢業于吉林工業大學。2005年創立北京盈智星科技發展有限公司,2008年聯合創立上海數聚軟件公司。獵兔搜索創始人,當前獵兔搜索在北京和上海以及石家莊均設有研發部。帶領獵兔搜索技術開發團隊先后開發出獵兔中文分詞系統、獵兔文本挖掘系統,智能垂直搜索系統以及網絡信息監測系統等,實現互聯網信息的采集、過濾、搜索和實時監測,其開發的搜索軟件日用戶訪問量達萬次以上。

商品評論(0條)
暫無評論……
書友推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 防爆暖风机_防爆电暖器_防爆电暖风机_防爆电热油汀_南阳市中通智能科技集团有限公司 | 工业用品一站式采购平台|南创工品汇-官网|广州南创 | 短信群发平台_群发短信软件_短信营销-讯鸽科技 | H型钢切割机,相贯线切割机,数控钻床,数控平面钻,钢结构设备,槽钢切割机,角钢切割机,翻转机,拼焊矫一体机 | 超声波_清洗机_超声波清洗机专业生产厂家-深圳市好顺超声设备有限公司 | 江苏密集柜_电动_手动_移动_盛隆柜业江苏档案密集柜厂家 | 土壤墒情监测站_土壤墒情监测仪_土壤墒情监测系统_管式土壤墒情站-山东风途物联网 | 根系分析仪,大米外观品质检测仪,考种仪,藻类鉴定计数仪,叶面积仪,菌落计数仪,抑菌圈测量仪,抗生素效价测定仪,植物表型仪,冠层分析仪-杭州万深检测仪器网 | 水性绝缘漆_凡立水_绝缘漆树脂_环保绝缘漆-深圳维特利环保材料有限公司 | 交联度测试仪-湿漏电流测试仪-双85恒温恒湿试验箱-常州市科迈实验仪器有限公司 | 防爆电机_ybx3系列电机_河南省南洋防爆电机有限公司 | 艺术涂料_进口艺术涂料_艺术涂料加盟_艺术涂料十大品牌 -英国蒙太奇艺术涂料 | 天然气分析仪-液化气二甲醚分析仪|传昊仪器 | 冷藏车-东风吸污车-纯电动环卫车-污水净化车-应急特勤保障车-程力专汽厂家-程力专用汽车股份有限公司销售二十一分公司 | 控显科技 - 工控一体机、工业显示器、工业平板电脑源头厂家 | 选矿设备,选矿生产线,选矿工艺,选矿技术-昆明昆重矿山机械 | 劳动法网-专业的劳动法和劳动争议仲裁服务网| 宜兴紫砂壶知识分享 - 宜兴壶人 医用空气消毒机-医用管路消毒机-工作服消毒柜-成都三康王 | 专业生产动态配料系统_饲料配料系统_化肥配料系统等配料系统-郑州鑫晟重工机械有限公司 | 广东燎了网络科技有限公司官网-网站建设-珠海网络推广-高端营销型外贸网站建设-珠海专业h5建站公司「了了网」 | 铆钉机|旋铆机|东莞旋铆机厂家|鸿佰专业生产气压/油压/自动铆钉机 | 行星齿轮减速机,减速机厂家,山东减速机-淄博兴江机械制造 | 丹佛斯压力传感器,WISE温度传感器,WISE压力开关,丹佛斯温度开关-上海力笙工业设备有限公司 | 网架支座@球铰支座@钢结构支座@成品支座厂家@万向滑动支座_桥兴工程橡胶有限公司 | 成都中天自动化控制技术有限公司 | 中宏网-今日新闻-财经新闻| 中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折! | 泰来华顿液氮罐,美国MVE液氮罐,自增压液氮罐,定制液氮生物容器,进口杜瓦瓶-上海京灿精密机械有限公司 | 洁净化验室净化工程_成都实验室装修设计施工_四川华锐净化公司 | 泥沙分离_泥沙分离设备_泥砂分离机_洛阳隆中重工机械有限公司 | 爱佩恒温恒湿测试箱|高低温实验箱|高低温冲击试验箱|冷热冲击试验箱-您身边的模拟环境试验设备技术专家-合作热线:400-6727-800-广东爱佩试验设备有限公司 | 球磨机 选矿球磨机 棒磨机 浮选机 分级机 选矿设备厂家 | 技德应用| 电抗器-能曼电气-电抗器专业制造商 | 整合营销推广|营销网络推广公司|石家庄网站优化推广公司|智营销 好物生环保网、环保论坛 - 环保人的学习交流平台 | CNC机加工-数控加工-精密零件加工-ISO认证厂家-鑫创盟 | 不锈钢螺丝 - 六角螺丝厂家 - 不锈钢紧固件 - 万千紧固件--紧固件一站式采购 | 风化石头制砂机_方解石制砂机_瓷砖石子制砂机_华盛铭厂家 | 南京租车,南京汽车租赁,南京包车,南京会议租车-南京七熹租车 | 法兰螺母 - 不锈钢螺母制造厂家 - 万千紧固件--螺母街 | 浙江华锤电器有限公司_地磅称重设备_防作弊地磅_浙江地磅售后维修_无人值守扫码过磅系统_浙江源头地磅厂家_浙江工厂直营地磅 |