-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰(zhàn)行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調(diào)優(yōu)實踐之路
-
>
第一行代碼Android
-
>
JAVA持續(xù)交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
文本挖掘與信息檢索概論 版權(quán)信息
- ISBN:9787302597445
- 條形碼:9787302597445 ; 978-7-302-59744-5
- 裝幀:70g膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>
文本挖掘與信息檢索概論 本書特色
可作為人工智能、數(shù)據(jù)科學、計算機、軟件工程等專業(yè)的高年級本科生和研究生教材,也對從事相關工作的科研人員具有一定參考價值。
文本挖掘與信息檢索概論 內(nèi)容簡介
文本挖掘與信息檢索是近年來人工智能領域的熱點研究方向。本書共8章,包括信息檢索概述、信息檢索模型、信息檢索的評價、文本分類技術、文本聚類技術、自動摘要技術、文本推薦技術和網(wǎng)頁鏈接分析,融合了統(tǒng)計學、機器學習、數(shù)據(jù)庫等知識,具有多學科交叉的特點。 內(nèi)容全面,案例豐富,適合作為人工智能、數(shù)據(jù)科學、計算機、軟件工程等專業(yè)的本科生和研究生教材,也可作為企事業(yè)單位相關研究人員的參考資料。
文本挖掘與信息檢索概論 目錄
目錄
第1章信息檢索概述
1.1數(shù)據(jù)、信息和知識
1.1.1從數(shù)據(jù)到信息
1.1.2從信息到知識
1.2信息檢索的定義
1.3信息檢索的發(fā)展
1.3.1信息檢索的發(fā)展歷史
1.3.2信息檢索的主要方法
1.3.3信息檢索的應用
1.3.4信息檢索的發(fā)展趨勢
習題
第2章信息檢索模型
2.1概述
2.2向量空間檢索模型
2.2.1內(nèi)積
2.2.2相似度計算
2.3概率檢索模型
2.3.1概率論基礎知識
2.3.2詞項權(quán)重
2.3.3二值獨立模型
2.3.4非二值獨立模型
2.4基于語言建模的信息檢索模型
2.4.1龐特模型
2.4.2零概率問題以及解決方法
2.4.3語言模型檢索框架
2.4.4跨語言檢索模型
習題
第3章信息檢索的評價
3.1信息檢索的評價指標
3.1.1查全率
3.1.2査準率
3.1.3查準率與查全率的關系
3.1.4漏檢率和誤檢率
3.1.5響應時間
3.2信息檢索系統(tǒng)的評價
習題
第4章文本分類技術
4.1概述
4.1.1基本概念
4.1.2文本自動分類的兩種類型
4.1.3文本分類模式
4.1.4文本分類過程
4.2文本預處理
4.2.1分詞技術
4.2.2停用詞去除
4.2.3文本特征選擇方法
4.2.4文本表示方法
4.3相似度度量方法
4.4常用分類算法分析
4.4.1Rocchio算法
4.4.2貝葉斯分類器
4.4.3貝葉斯信念網(wǎng)絡
4.4.4K近鄰算法
4.4.5支持向量機
4.5分類性能評價
4.5.1精確度和召回率
4.5.2F測量
4.5.3分類方法的綜合評價
4.6基于向量空間模型的文本分類方法
4.6.1文本分類系統(tǒng)的結(jié)構(gòu)框架
4.6.2改進的文本特征抽取算法
4.6.3二級分類模式
4.7基于語言模型的文本分類
4.7.1概述
4.7.2Bigram模型
4.7.3特征提取
4.7.4分類器設計
4.7.5統(tǒng)計平滑
4.8基于卷積神經(jīng)網(wǎng)絡的文本分類
4.8.1CNN概述
4.8.2CNN文本分類經(jīng)典結(jié)構(gòu)
4.8.3CNN文本分類方法
習題
第5章文本聚類技術
5.1概述
5.2常用的聚類方法
5.2.1基于劃分的聚類方法
5.2.2基于分層的聚類方法
5.2.3基于密度的聚類方法
5.2.4基于網(wǎng)格的聚類方法
5.2.5基于模型的聚類方法
5.3聚類算法的評價標準
5.4基于Kmeans的文本聚類算法
5.4.1概述
5.4.2Kmeans算法理論基礎
5.4.3Kmeans算法結(jié)果影響因素
5.4.4TFIDF理論基礎
5.4.5基于Kmeans文本聚類的主要步驟
5.4.6基于Kmeans算法的聚類實例
5.5基于潛在語義索引的文本聚類方法
5.5.1概述
5.5.2矩陣的奇異值分解
5.5.3LSI技術的理論基礎
5.5.4基于LSI文本聚類的主要步驟
5.5.5基于LSI文本聚類的實例
5.6基于Word2Vec的文本聚類方法
5.6.1詞向量概述
5.6.2Word2Vec語言模型
5.6.3連續(xù)詞袋模型
5.6.4Skipgram模型
5.6.5基于Word2Vec的文本聚類舉例
習題
第6章自動摘要技術
6.1概述
6.2抽取式摘要
6.2.1基于TextRank的文本自動摘要
6.2.2基于圖模型的文本自動摘要
6.2.3融合噪聲檢測的多文檔自動摘要
6.2.4抽取式多文檔自動摘要
6.3生成式摘要
6.3.1融合詞匯特征的生成式摘要模型
6.3.2基于深度學習的文本自動摘要
6.3.3基于HITS注意力神經(jīng)網(wǎng)絡的生成式摘要模型
6.4自動摘要的評價方法
6.4.1內(nèi)部評價法
6.4.2外部評價法
習題
第7章文本推薦技術
7.1基于內(nèi)容的推薦方法
7.1.1概述
7.1.2存在的問題
7.2基于協(xié)同過濾的推薦方法
7.2.1基于用戶的協(xié)同過濾推薦方法
7.2.2基于物品的協(xié)同過濾推薦方法
7.2.3存在的問題
7.3混合推薦方法
7.4基于圖表示學習的推薦方法
7.4.1圖表示學習方法
7.4.2基于圖表示學習的推薦
7.4.3基于DeepWalk異構(gòu)文獻網(wǎng)絡表示學習的個性化全局
引文推薦方法
7.5推薦系統(tǒng)的評價
7.5.1評價指標
7.5.2基于DeepWalk異構(gòu)文獻網(wǎng)絡表示學習的個性化全局引文推薦方法
的實驗結(jié)果分析
習題
第8章網(wǎng)頁鏈接分析
8.1超鏈和頁面內(nèi)容的關系
8.2特征提取和特征表示
8.3不同搜索階段的分析
8.4PageRank算法
8.4.1PageRank算法定義
8.4.2PageRank算法的優(yōu)點和缺點
8.4.3基于LexRank的多文檔自動摘要方法
8.5HITS算法
8.5.1HITS算法定義
8.5.2尋找其他的特征向量
8.5.3尋找同引分析和文獻耦合的關系
8.5.4HITS算法的優(yōu)點和缺點
8.5.5基于HITS的多文檔自動摘要
8.6兩種算法的比較
8.7鏈接分析的應用
習題
參考文獻
- >
二體千字文
- >
龍榆生:詞曲概論/大家小書
- >
上帝之肋:男人的真實旅程
- >
姑媽的寶刀
- >
伊索寓言-世界文學名著典藏-全譯本
- >
有舍有得是人生
- >
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
- >
莉莉和章魚