-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
機械工業出版社ELASTICSEARCH搜索引擎開發實戰 版權信息
- ISBN:9787111603481
- 條形碼:9787111603481 ; 978-7-111-60348-1
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
機械工業出版社ELASTICSEARCH搜索引擎開發實戰 本書特色
深入剖析大規模分布式搜索引擎的實現原理,詳解Elasticsearch開發搜索引擎的相關技術 涵蓋大數據搜索引擎融合、自然語言處理與搜索引擎融合、Spring Boot與Vue.js前端融合等相關技術 詳解57個經典實例、3個綜合項目案例、25個原理圖 詳解多個搜索算法,每個算法都有廣泛的應用前景 通過大量實例和綜合案例手把手帶領讀者快速上手 書中的實例和綜合案例大多來源于作者負責的實際項目 本書精華內容: 基于中文分詞的中文搜索算法 基于字詞混合索引的搜索算法 英文分詞算法 英文句子切分算法 Word2vec實現算法 人臉識別融合 CURL爬蟲算法 OkHttp爬蟲 EM算法實現詞對齊 CRC32算法檢驗文件完整性 Netty通信框架分析 Zen發現機制 Spring Boot MVC開發Web應用 Vue.js開發前端應用 Elasticsearch生成JSON串 雙語句對搜索案例 內容管理系統站內檢索案例 藥物臨床試驗項目信息爬蟲案例 本書配套資源: 本書配套教學PPT 本書源代碼文件 本書涉及的一些開發工具的安裝包
機械工業出版社ELASTICSEARCH搜索引擎開發實戰 內容簡介
本書結合Elasticsearch在工程中的實際應用,詳細介紹了使用Elasticsearch開發支持中文和英文搜索引擎的相關技術,從而實現系統監控。本書共分為8章,內容涵蓋了Elasticsearch搜索引擎開發的環境安裝與配置,實現一個簡單的網站搜索;開發中文搜索引擎;Mapping詳解;源代碼分析;提高搜索相關性;使用SpringBoot開發搜索界面;使用Elasticsearch和相關軟件實現系統監控;搜索引擎開發案例分析。本書很好適合信息檢索技術愛好者、搜索引擎開發人員和搜索引擎優化(SEO)人員閱讀,也適合作為高等院校信息檢索課程的教材或教學參考書。
機械工業出版社ELASTICSEARCH搜索引擎開發實戰 目錄
前言
第1章 Elasticsearch開發搜索引擎應用1
1.1 搜索引擎開發需求1
1.2 準備開發環境1
1.2.1 Windows命令行cmd1
1.2.2 在Windows下使用Java3
1.2.3 Linux終端5
1.2.4 在Linux下使用Java9
1.2.5 Eclipse集成開發環境10
1.3 了解Elasticsearch10
1.3.1 JSON數據格式11
1.3.2 Elasticsearch基本概念12
1.3.3 HTTP協議13
1.4 Elasticsearch安裝和配置16
1.4.1 安裝Elasticsearch16
1.4.2 運行Elasticsearch作為服務進程19
1.5 實現一個簡單的網站搜索21
1.5.1 定義索引結構23
1.5.2 導入數據26
1.5.3 查詢API27
1.5.4 實現搜索界面29
1.6 本章小結35
第2章 開發中文搜索引擎36
2.1 中文分詞原理36
2.1.1 *長匹配方法36
2.1.2 自己寫分析器42
2.1.3 概率語言模型的分詞方法44
2.1.4 中文分詞插件原理52
2.1.5 開發中文分詞插件54
2.1.6 支持Elasticsearch的插件57
2.1.7 中文分析器提供者59
2.1.8 字詞混合索引61
2.2 提高分詞準確度63
2.3 本章小結65
第3章 Mapping詳解66
3.1 索引模式66
3.1.1 創建模式66
3.1.2 修改模式68
3.2 Mapping數據類型69
3.3 Mapping參數70
3.4 動態Mapping71
3.4.1 使用動態Mapping72
3.4.2 實現原理72
3.5 本章小結74
第4章 深入源碼分析75
4.1 Lucene源碼分析75
4.1.1 使用Lucene75
4.1.2 Ivy管理依賴項77
4.1.3 源碼結構介紹77
4.1.4 并發控制82
4.2 啟動搜索服務88
4.3 Guice框架89
4.4 日期和時間庫——Joda-Time91
4.5 Transport模塊91
4.6 線程池92
4.7 模塊93
4.8 Netty通信框架93
4.9 緩存94
4.10 分布式95
4.11 Zen發現機制95
4.12 聯合搜索97
4.13 JVM字節碼98
4.13.1 編譯代碼99
4.13.2 同步相關指令99
4.14 本章小結100
第5章 提高搜索相關性102
5.1 向量空間檢索模型102
5.2 BM25檢索模型105
5.2.1 使用BM25檢索模型108
5.2.2 參數調優108
5.3 學習評分109
5.3.1 基本原理109
5.3.2 準備數據110
5.3.3 Elasticsearch學習排名112
5.4 查詢意圖識別112
5.5 圖像特征提升檢索體驗113
5.6 本章小結116
第6章 搜索界面開發118
6.1 使用Searchkit實現搜索界面118
6.2 Spring Boot入門122
6.2.1 可執行的WAR125
6.2.2 spring-boot-devtools模塊實現熱部署136
6.3 Java模板引擎Pebble介紹136
6.4 通過Spring-data-elasticsearch 項目訪問Elasticsearch141
6.5 REST基本概念149
6.6 使用Vue.js開發搜索界面154
6.7 使用Vue.js Paginator插件實現翻頁157
6.8 實現搜索接口161
6.8.1 編碼識別161
6.8.2 布爾搜索163
6.8.3 搜索結果重定向164
6.8.4 搜索結果排序165
6.8.5 實現相似文檔搜索166
6.9 Suggester搜索詞提示167
6.9.1 拼音提示169
6.9.2 部署總結169
6.9.3 相關搜索170
6.9.4 再次查找172
6.9.5 搜索日志172
6.10 Word2vec挖掘相關搜索詞174
6.11 部署網站179
6.11.1 部署到Web服務器179
6.11.2 防止攻擊181
6.12 使用Rust開發搜索界面184
6.13 本章小結184
第7章 Elastic棧系統監控186
7.1 管理Elasticsearch集群186
7.1.1 寫入權限控制187
7.1.2 使用X-Pack188
7.1.3 快照189
7.2 Logstash數據處理工具190
7.2.1 使用Logstash190
7.2.2 插件192
7.2.3 數據庫輸入插件192
7.2.4 開發插件193
7.3 Filebeat文件收集器193
7.4 消息過期194
7.5 Kibana可視化平臺195
7.6 Flume日志收集系統196
7.7 Kafka分布式流平臺197
7.8 Graylog日志管理平臺198
7.9 本章小結202
第8章 案例分析204
8.1 雙語句對搜索204
8.1.1 爬蟲抓取雙語句對204
8.1.2 英文分詞205
8.1.3 句子切分205
8.1.4 標注詞性207
8.1.5 詞對齊209
8.1.6 索引數據213
8.2 內容管理系統站內檢索214
8.2.1 MySQL數據庫214
8.2.2 RESTful API管理索引215
8.2.3 自動客服機器人217
8.3 搜索文檔225
8.3.1 爬蟲抓取信息225
8.3.2 在Linux下使用.NET233
8.3.3 NEST客戶端235
8.4 本章小結239
參考文獻240
機械工業出版社ELASTICSEARCH搜索引擎開發實戰 作者簡介
羅剛 畢業于吉林大學。獵兔搜索創始人、IT培訓講師。曾經擔任新東方創新研究院研究員,并擔任首都師范大學研究生兼職講師。創立獵兔搜索后帶領團隊先后開發出獵兔中文分詞系統、獵兔信息提取系統、獵兔智能垂直搜索系統及互聯網信息監測系統等,實現了互聯網信息的采集、過濾、挖掘、搜索和實時監測。編寫并出版了《自己動手寫搜索引擎》《自己動手寫網絡爬蟲》《使用C#開發搜索引擎》《網絡爬蟲全解析》等技術書籍。 張子憲 曾經在美國北喬治亞大學從事語言信息處理方面的研究和教學工作。現任教于聊城大學,從事自然語言處理的研究和教學工作,并從事機器翻譯和計算機輔助翻譯等領域的研究。在《中國科技論文》等核心期刊上發表過多篇論文。
- >
隨園食單
- >
回憶愛瑪儂
- >
史學評論
- >
【精裝繪本】畫給孩子的中國神話
- >
唐代進士錄
- >
莉莉和章魚
- >
詩經-先民的歌唱
- >
中國歷史的瞬間