中圖網

>

圖書館學檔案學

海量網絡學術文獻自動分類研究

包郵海量網絡學術文獻自動分類研究

作者：王效岳等著

出版社：人民出版社出版時間：2015-11-01

開本： 16開 頁數： 245

本類榜單：社會科學銷量榜

中圖價:¥15.1(4.0折) 定價 ~~¥38.0~~ 登錄后可看到會員價

加入購物車收藏

開年大促， 全場包郵

?新疆、西藏除外

溫馨提示：5折以下圖書主要為出版社尾貨，大部分為全新（有塑封/無塑封），個別圖書品相8-9成新、切口
有劃線標記、光盤等附件不全詳細品相說明>>

本類五星書更多>

>
妙相梵容

妙相梵容

¥45.4¥168
>
基立爾蒙文:蒙文

基立爾蒙文:蒙文

¥8.2¥20
>
我的石頭記

我的石頭記

¥23¥50
>
心靈元氣社

心靈元氣社

¥48.9¥69.8
>
女性生存戰爭

女性生存戰爭

¥29.9¥66
>
縣中的孩子中國縣域教育生態

縣中的孩子中國縣域教育生態

¥57.3¥88
>
(精)人類的明天(八品)

(精)人類的明天(八品)

¥40.5¥88

買過本商品的人還買了

思考的本質:杜威論邏輯思維
[美]約翰·杜威著，章瑋譯
¥16.1~~¥39.8~~
守護正義:西方司法之路
宋濤著;陳曉律叢書主編
¥22.3~~¥38.0~~
中國的佛教
麻天祥
¥44.5~~¥69.0~~
社會生活、社會態度和觀念意識:以全國六省市調查為例
翁定軍馬磊馬艷鳳著
¥36.9~~¥49.8~~
語文符號學
周慶華著
¥13.2~~¥38.0~~

商品詳情
商品評論(0條)

中圖價:¥15.1 加入購物車

版權信息
內容簡介
目錄
節選
作者簡介

海量網絡學術文獻自動分類研究版權信息

ISBN：9787010148472
條形碼：9787010148472 ; 978-7-01-014847-2
裝幀：一般膠版紙
冊數：暫無
重量：暫無
所屬分類：
社會科學
>
圖書館學檔案學

海量網絡學術文獻自動分類研究內容簡介

　　本書針對文本分類方法在發展過程中出現的問題，圍繞“本體及其在文本分類中的應用”和“海量網絡學術文獻自動分類”兩個方面展開探討。深入研究了海量網絡學術文獻處理技術，比較分析了適合網絡文獻自動獲取及并行處理的工具；設計了基于Heritrix與Hadoop平臺的海量網絡學術文獻獲取及并行處理模型和基于WordNet與SUMO本體集成的語義驅動自動文檔分類模型；梳理了本體以及本體集成理論、方法和工具；開發了海量網絡學術文獻并行獲取和自動分類原型系統。

海量網絡學術文獻自動分類研究目錄

序
緒論
**章網絡爬蟲
**節網絡爬蟲
一、開源網絡爬蟲工具
二、爬蟲工具比較分析
第二節 Hadoop平臺
一、Hadoop與其他系統的比較
二、Hadoop項目及結構
三、Hadoop分布式文件系統
四、MapReduce編程模型
五、Hadoop平臺搭建
第二章海量網絡學術文獻獲取及并行處理模型
**節網絡學術文獻的主要來源及常用文件格式
一、網絡學術文獻的主要來源及特點
二、網絡學術文獻的常用文件格式
第二節網絡學術文獻自動獲取實驗
一、實驗環境
二、實驗平臺搭建
第三節網絡學術文獻資源獲取
一、網絡學術文獻獲取方案
二、種子站點的選擇
三、抓取任務的配置
四、文件類型和大小過濾
五、網絡學術文獻獲取實驗結果
第四節網絡學術文獻資源判定
第五節網絡學術文獻并行處理
一、數據預處理
二、并行處理
第六節 MapReduce任務優化
一、任務調度
二、任務數量
三、Combine函數
四、文件壓縮
五、重用JVM
六、網絡學術文獻并行處理模塊實驗結果
第三章本體集成
**節本體研究
一、本體概念
二、本體基本構成要素
三、本體類型
四、本體表示語言
第二節本體庫研究
一、國內外主要本體庫
二、本體庫比較分析
第三節本體集成基本過程
第四節本體集成工具
一、工具介紹
二、工具比較與分析
第五節本體集成方法
一、基于形式概念分析（FCA）的本體集成方法
二、基于范疇論的本體集成方法
三、基于RDFS圖閉包的本體集成方法
第四章基于語義驅動文本自動分類研究
**節文檔自動分類基本理論
一、文檔自動分類基本概念
二、文檔自動分類基本流程
三、文檔自動分類性能評價指標
第二節基于語義驅動文檔自動分類概念
第三節基于語義驅動文檔自動分類實現基礎
第四節基于語義驅動文檔自動分類方法模型
一、詞向量空間構建
二、語義向量空間構建
第五章基于本體集成的文檔語義分類模型
**節 SUMO和WordNet本體庫概述
一、WordNet本體庫
二、SUMO本體庫
第二節 WordNet與SUMO本體庫映射機制研究
一、映射動機
二、映射模型
三、映射實例
四、映射效果及應用分析
第三節基于WordNet與SUMO本體集成文檔語義分類模型設計與實現
一、實驗平臺構建
二、實驗數據集及方法
三、集成本體庫構建
四、詞向量空間到概念向量空間的映射
五、概念向量空間通用化
六、分類模型訓練與測試過程描述
七、實驗評估指標
八、實驗及結果分析
第六章海量網絡學術文獻自動分類系統
**節海量網絡學術文獻自動分類系統
一、開發環境
二、海量網絡學術文獻自動獲取模塊
三、海量網絡學術文獻詞一文檔矩陣處理模塊
四、本體集成模塊
五、基于語義驅動的分類模塊
第二節海量網絡學術文獻自動分類系統實現
一、系統主要技術及標準
二、系統功能
第七章總結及展望
**節總結
第二節展望
附錄A
附錄B
附錄C
附錄D
參考文獻
索引
后記

展開全部

海量網絡學術文獻自動分類研究節選

　　《海量網絡學術文獻自動分類研究》：　　HDFS中的塊是一個抽象概念，作為分布式文件系統，HDFS被設計用來處理大文件，使用抽象塊會帶來很多好處。**個好處是，一個文件可以大于網絡中任意一個磁盤的容量，文件的分塊不需要存儲在同一個磁盤上，可以利用集群上的任意一個磁盤；第二個好處是，使用抽象塊而不是文件，作為操作單元，可簡化存儲子系統。簡化存儲子系統是所有系統的追求，但對于故障種類繁多的分布式系統來說尤為重要，存儲子系統控制的是塊，簡化了存儲管理。HDFS的塊大小是固定的，這樣就簡化了存儲系統的管理，特別是元數據信息可以和文件塊內容分開存儲；第三個好處是，塊有利于提供容錯和實用性而做的復制操作，在HDFS中為了處理節點故障，默認將副本數設定為3份，分別存儲在集群的不同節點上。當一個塊損壞時，系統會通過名稱節點獲取元數據信息，在另外的機器上讀取一個副本并進行存儲。文件塊副本數可以根據需要進行配置，比如在有些應用中，可能會為操作頻率較高的文件塊，設置較高的副本數量以提高集群的吞吐量。　　2.名稱節點與數據節點　　HDFS體系結構中有兩類節點：名稱節點（NameNode）和數據節點（DataNode）。在Hadoop集群中，一般會有一個名稱節點和多個數據節點，名稱節點管理集群中的任務調度，數據節點是具體任務的執行節點。名稱節點通過遠程過程調用接口，支持文件系統命名空間中文件和目錄的打開、關閉和重命名等操作，決定數據塊和數據節點的映射關系。名稱節點負責維護文件系統的命名空間和客戶端的文件訪問，從名稱節點中可以獲得所有文件每個塊所在的數據節點，這些信息不是永久保存的，名稱節點會在每次啟動系統時動態地自動重建這些信息。當運行任務時，客戶端通過名稱節點獲取元數據信息，和數據節點進行交互以訪問整個文件系統。　　……

海量網絡學術文獻自動分類研究作者簡介

　　王效岳，男，1961年生，工學博士，教授，山東理工大學科技信息研究所所長。中國圖書館學會高等學校圖書館分會委員，山東省科技情報學會副理事長，山東省圖書館學會常務理事。研究方向為數據挖掘與信息處理技術。主編及參編學術著作6部，省部級課題6項、廳局級課題10余項，發表學術論文80余篇，其中被EI、CSSCI索引30余篇。授權發明專利3項。獲省科技進步3等獎l項，廳局級科技進步2等獎2項、3等獎3項。白如江，男，1979年生，管理學博士，副研究館員，山東理工大學圖書館數字資源部主任。研究領域包括文本數據挖掘、自然語言處理、信息檢索技術、高科技戰略情報研究等。主持國家社科青年基金項目l項，教育部人文社會科學青年基金項目等省部級課題多項。

商品評論(0條)

寫書評賺書幣

暫無評論……

書友推薦

>
莉莉和章魚
莉莉和章魚
[美]史蒂文·羅利著，祝文亭譯
¥15.3~~¥42.0~~
>
巴金－再思錄
巴金－再思錄
巴金
¥15.7~~¥46.0~~
>
苦雨齋序跋文-周作人自編集
苦雨齋序跋文-周作人自編集
周作人著，止庵校訂
¥6.1~~¥16.0~~
>
伯納黛特,你要去哪(2021新版)
伯納黛特,你要去哪(2021新版)
[美] 瑪利亞·森普爾著，何雨珈譯
¥16.9~~¥49.8~~
>
唐代進士錄
唐代進士錄
陶易
¥16.1~~¥39.8~~
>
經典常談
經典常談
朱自清
¥13.7~~¥39.8~~
>
朝聞道
朝聞道
劉慈欣
¥16.5~~¥23.8~~
>
有舍有得是人生
有舍有得是人生
梁實秋
¥25.7~~¥45.0~~

本類暢銷

書墨

王春瑜著

¥13.9~~¥34~~
古文獻研究集刊-第三輯

趙生群.方向東主編

¥13.2~~¥30~~
古文獻研究集刊(第一輯)

趙生群，方向東　主編

¥11.5~~¥26~~
訓詁簡論

陸宗達

¥22.6~~¥36~~
中國目錄學史-民國學術文化名著

姚名達

¥15.2~~¥27~~
聽,書的聲音！日本選書人幅允孝的工作

高瀨毅

¥19.9~~¥59~~

中图网(原中国图书网)：网上书店，尾货特色书店，30万种特价书低至2折！

包郵海量網絡學術文獻自動分類研究

思考的本質:杜威論邏輯思維

守護正義:西方司法之路

中國的佛教

社會生活、社會態度和觀念意識:以全國六省市調查為例

語文符號學

海量網絡學術文獻自動分類研究版權信息

海量網絡學術文獻自動分類研究內容簡介

海量網絡學術文獻自動分類研究目錄

海量網絡學術文獻自動分類研究節選

海量網絡學術文獻自動分類研究作者簡介

莉莉和章魚

巴金－再思錄

苦雨齋序跋文-周作人自編集

伯納黛特,你要去哪(2021新版)

唐代進士錄

經典常談

朝聞道

有舍有得是人生

書墨

古文獻研究集刊-第三輯

古文獻研究集刊(第一輯)

訓詁簡論

中國目錄學史-民國學術文化名著

聽,書的聲音！日本選書人幅允孝的工作

陶潛和櫻子

人間草木

俄羅斯書簡

女孩們

熊千佳昆蟲記

張學良人格圖譜

包郵 海量網絡學術文獻自動分類研究

海量網絡學術文獻自動分類研究 版權信息

海量網絡學術文獻自動分類研究 內容簡介

海量網絡學術文獻自動分類研究 目錄

海量網絡學術文獻自動分類研究 節選

海量網絡學術文獻自動分類研究 作者簡介

包郵海量網絡學術文獻自動分類研究

海量網絡學術文獻自動分類研究版權信息

海量網絡學術文獻自動分類研究內容簡介

海量網絡學術文獻自動分類研究目錄

海量網絡學術文獻自動分類研究節選

海量網絡學術文獻自動分類研究作者簡介