-
>
全國(guó)計(jì)算機(jī)等級(jí)考試最新真考題庫(kù)模擬考場(chǎng)及詳解·二級(jí)MSOffice高級(jí)應(yīng)用
-
>
決戰(zhàn)行測(cè)5000題(言語(yǔ)理解與表達(dá))
-
>
軟件性能測(cè)試.分析與調(diào)優(yōu)實(shí)踐之路
-
>
第一行代碼Android
-
>
JAVA持續(xù)交付
-
>
EXCEL最強(qiáng)教科書(shū)(完全版)(全彩印刷)
-
>
深度學(xué)習(xí)
文本挖掘中若干關(guān)鍵問(wèn)題研究 版權(quán)信息
- ISBN:9787312022807
- 條形碼:9787312022807 ; 978-7-312-02280-7
- 裝幀:暫無(wú)
- 冊(cè)數(shù):暫無(wú)
- 重量:暫無(wú)
- 所屬分類:>
文本挖掘中若干關(guān)鍵問(wèn)題研究 本書(shū)特色
自動(dòng)文本分類是將自然文本文件根據(jù)內(nèi)容自動(dòng)分為預(yù)先定義的一個(gè)或幾個(gè)類別的過(guò)程,基于統(tǒng)計(jì)學(xué)習(xí)、機(jī)器學(xué)習(xí)的文本分類技術(shù)已經(jīng)成為主流技術(shù),本書(shū)對(duì)基于統(tǒng)計(jì)學(xué)習(xí)的文本分類及其相關(guān)技術(shù)進(jìn)行了研究,為解決文本分類的稀疏性和高維性問(wèn)題,基于偏*小二乘理論,提出一種新的維數(shù)約簡(jiǎn)算法,從提高文本分類性能和準(zhǔn)確性出發(fā),運(yùn)用偏*小二乘的*新理論成果,提出了一種能較好提取潛在語(yǔ)義的新文本分類模型,對(duì)于數(shù)量龐大的文檔類別,傳統(tǒng)的平坦文本分類的性能受到很大的制約,層次文本分類是一種有效的解決方法,由此提出了一種新的層次文本分類模型。
文本挖掘中若干關(guān)鍵問(wèn)題研究 內(nèi)容簡(jiǎn)介
本書(shū)介紹了文本分類和偏*小二乘回歸,提出了基于變量投影重要性指標(biāo)的文本分類特征選擇方法,論述了偏*小二乘logistic文本分類模型,闡述了chtc層次文本分類模型的研究工作,本書(shū)可供相關(guān)領(lǐng)域科研工作者、大學(xué)高年級(jí)學(xué)生和研究生閱讀。
文本挖掘中若干關(guān)鍵問(wèn)題研究 目錄
第1章 導(dǎo)論
1.1 研究背景
1.2 文本分類綜述
1.3 本書(shū)的內(nèi)容結(jié)構(gòu)
1.4 本書(shū)的創(chuàng)新工作
第2章 文本分類概述
2.1 文本分類的數(shù)學(xué)定義
2.2 文本分類任務(wù)的特點(diǎn)
2.3 文本分類系統(tǒng)的組成
2.4 文檔預(yù)處理
2.5 文檔的表示
2.6 常用文本分類模型
2.7 文本分類器學(xué)習(xí)、測(cè)試和評(píng)價(jià)
第3章 偏*小二乘回歸方法的基本理論
3.1 偏*小二乘回歸的發(fā)展歷史
3.2 偏*小二乘回歸的基本原理
3.3 偏*小二乘回歸的基本思想
3.4 數(shù)學(xué)原理
3.5 偏*小二乘回歸的理論算法
3.6 成分?jǐn)?shù)的確定
第4章 基于變量投影重要性指標(biāo)的特征選擇方法研究
4.1 維數(shù)約簡(jiǎn)技術(shù)
4.2 符號(hào)約定
4.3 常用的特征選擇方法
4.4 常用的特征抽取方法
4.5 基于變量投影重要性指標(biāo)的特征選擇方法
4.6 實(shí)驗(yàn)結(jié)果和分析
第5章 偏*小二乘logistic文本分類模型研究
5.1 logistic回歸模型
5.2 偏*小二乘logistic回歸模型
5.3 偏*小二乘logistic文本分類模型
5.4 實(shí)驗(yàn)結(jié)果和分析
第6章 ghtc層次文本分類模型研究
6.1 層次分類概述
6.2 層次特征選擇
6.3 ghtc層次文本分類模型
6.4 實(shí)驗(yàn)結(jié)果和分析
第7章 總結(jié)與展望
7.1 總結(jié)
7.2 研究展望
附錄1 reuters-21578前10個(gè)常見(jiàn)類和前10個(gè)稀有類的前20個(gè)特征vip值
附錄2 復(fù)旦文本分類語(yǔ)料庫(kù)部分類別的前20個(gè)特征vip值
附錄3 ohsumed語(yǔ)料庫(kù)層次結(jié)構(gòu)
附錄4 20 newsgroups語(yǔ)料庫(kù)各節(jié)點(diǎn)各特征維數(shù)的微平均f1值和宏平均f1值變化情況
參考文獻(xiàn)
后記
文本挖掘中若干關(guān)鍵問(wèn)題研究 節(jié)選
《文本挖掘中若干關(guān)鍵問(wèn)題研究》介紹了文本分類和偏*小二乘回歸,提出了基于變量投影重要性指標(biāo)的文本分類特征選擇方法,論述了偏*小二乘Logistic文本分類模型,闡述了CHTC層次文本分類模型的研究工作,《文本挖掘中若干關(guān)鍵問(wèn)題研究》可供相關(guān)領(lǐng)域科研工作者、大學(xué)高年級(jí)學(xué)生和研究生閱讀。
- >
名家?guī)阕x魯迅:故事新編
- >
詩(shī)經(jīng)-先民的歌唱
- >
【精裝繪本】畫(huà)給孩子的中國(guó)神話
- >
名家?guī)阕x魯迅:朝花夕拾
- >
新文學(xué)天穹兩巨星--魯迅與胡適/紅燭學(xué)術(shù)叢書(shū)(紅燭學(xué)術(shù)叢書(shū))
- >
巴金-再思錄
- >
有舍有得是人生
- >
羅曼·羅蘭讀書(shū)隨筆-精裝