中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >>
Java中文文本信息處理-從海量到精準

包郵 Java中文文本信息處理-從海量到精準

出版社:清華大學出版社出版時間:2017-05-01
開本: 32開 頁數: 396
中 圖 價:¥22.3(4.0折) 定價  ¥56.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
溫馨提示:5折以下圖書主要為出版社尾貨,大部分為全新(有塑封/無塑封),個別圖書品相8-9成新、切口
有劃線標記、光盤等附件不全詳細品相說明>>
本類五星書更多>
買過本商品的人還買了

Java中文文本信息處理-從海量到精準 版權信息

Java中文文本信息處理-從海量到精準 本書特色

本書以讓零基礎的讀者通過自學完成一個中文分詞系統為目標,從Java基礎語法開始講解,然后介紹文本處理相關的數據結構和算法,*后介紹如何實現文本切分和詞性標注。 本書是介紹業界熱門的以Java開發中文分詞技術的*書籍。本書選取相關領域的經典內容,深入理解和挖掘,也綜合了實踐性強的創新想法,適合對軟件開發感興趣的青少年或者大學生閱讀和學習。

Java中文文本信息處理-從海量到精準 內容簡介

全書以零基礎的讀者自學完成一個中文分詞系統作為目標。從Java基礎語法開始,然后到文本處理相關的數據結構和算法,*后實現文本切分和詞性標注。本書是少有的介紹業界熱門的Java開發中文分詞的書籍。本書選取相關領域的經典內容深入理解和挖掘,也綜合了實踐性強的創新想法。適用于對軟件開發感興趣的青少年或者大學生。

Java中文文本信息處理-從海量到精準 目錄

目 錄 第1章 Java軟件開發 1 1.1 背景 3 1.1.1 好身體是一切成功的保證 3 1.1.2 路線圖 4 1.1.3 Java 4 1.2 軟件工具 7 1.2.1 搜索引擎 7 1.2.2 Windows命令行 8 1.2.3 機器翻譯 9 1.2.4 Linux 10 1.2.5 源代碼比較工具 11 1.3 Java基礎 11 1.3.1 準備開發環境 11 1.3.2 Eclipse 13 1.4 本章小結 17 第2章 結構化程序設計 19 2.1 基本數據類型 19 2.2 變量 20 2.2.1 表達式執行順序 22 2.2.2 簡化的運算符 23 2.2.3 常量 24 2.3 控制結構 25 2.3.1 語句 25 2.3.2 判斷條件 25 2.3.3 三元運算符 27 2.3.4 條件判斷 27 2.3.5 循環 31 2.4 方法 36 2.4.1 main方法 41 2.4.2 遞歸調用 41 2.4.3 方法調用棧 42 2.5 數組 42 2.5.1 數組求和 45 2.5.2 計算平均值舉例 45 2.5.3 前趨節點數組 46 2.5.4 快速復制 47 2.5.5 循環不變式 49 2.6 字符串 50 2.6.1 字符編碼 52 2.6.2 格式化 53 2.6.3 增強switch語句 54 2.7 數值類型 54 2.7.1 類型轉換 58 2.7.2 整數運算 59 2.7.3 數值運算 60 2.7.4 位運算 61 2.8 安裝Java 69 2.8.1 服務器端安裝 69 2.8.2 自動安裝Java 70 2.9 提高代碼質量 72 2.9.1 代碼整潔 72 2.9.2 單元測試 72 2.9.3 調試 73 2.9.4 重構 73 2.10 本章小結 74 第3章 面向對象編程 77 3.1 類和對象 77 3.1.1 類 78 3.1.2 類方法 78 3.1.3 類變量 79 3.1.4 實例變量 79 3.1.5 構造方法 82 3.1.6 對象 84 3.1.7 實例方法 87 3.1.8 調用方法 89 3.1.9 內部類 89 3.1.10 克隆 90 3.1.11 結束 91 3.2 繼承 92 3.2.1 重寫 92 3.2.2 繼承構造方法 94 3.2.3 接口 95 3.2.4 匿名類 98 3.2.5 類的兼容性 98 3.3 封裝 98 3.4 重載 99 3.5 靜態 100 3.5.1 靜態變量 100 3.5.2 靜態類 100 3.5.3 修飾類的關鍵詞 101 3.6 枚舉類型 101 3.7 集合類 105 3.7.1 動態數組 105 3.7.2 散列表 106 3.7.3 泛型 109 3.7.4 Google Guava集合 112 3.7.5 類型擦除 112 3.7.6 遍歷 114 3.7.7 排序 117 3.7.8 lambda表達式 119 3.8 比較 119 3.8.1 Comparable接口 119 3.8.2 比較器 120 3.9 SOLID原則 122 3.10 異常 123 3.10.1 斷言 123 3.10.2 Java中的異常 124 3.10.3 從方法中拋出異常 126 3.10.4 處理異常 128 3.10.5 正確使用異常 130 3.11 字符串對象 132 3.11.1 字符對象 135 3.11.2 查找字符串 135 3.11.3 修改字符串 136 3.11.4 格式化 136 3.11.5 常量池 137 3.11.6 關于對象不可改變 139 3.12 日期 140 3.13 大數對象 141 3.14 給方法傳參數 142 3.14.1 基本類型和對象 143 3.14.2 重載 145 3.15 文件操作 146 3.15.1 文本文件 146 3.15.2 二進制文件 149 3.15.3 文件位置 152 3.15.4 讀寫Unicode編碼的文件 153 3.15.5 文件描述符 155 3.15.6 對象序列化 156 3.15.7 使用IOUtils 160 3.16 Java類庫 161 3.16.1 使用Java類庫 162 3.16.2 構建JAR包 163 3.16.3 使用Ant 167 3.16.4 生成JavaDoc 167 3.16.5 ClassLoader 168 3.16.6 反射 172 3.17 編程風格 173 3.17.1 命名規范 173 3.17.2 流暢接口 174 3.17.3 日志 175 3.18 IDEA 181 3.19 實例 181 3.20 本章小結 183 第4章 處理文本 185 4.1 字符串操作 185 4.2 有限狀態機 188 4.2.1 從NFA到DFA 190 4.2.2 DFA 194 4.2.3 DFA交集 197 4.2.4 DFA并集 203 4.2.5 有限狀態轉換 204 4.3 本章小結 207 第5章 數據結構 209 5.1 鏈表 209 5.2 樹算法 210 5.2.1 標準Trie樹 211 5.2.2 鏈表Trie樹 221 5.2.3 二叉搜索樹 223 5.2.4 數組形式的二叉樹 227 5.2.5 三叉Trie樹 233 5.2.6 三叉Trie樹交集 244 5.2.7 Trie樹詞典 245 5.2.8 平衡Trie樹 249 5.2.9 B樹 250 5.3 雙數組Trie 251 5.4 隊列 257 5.4.1 鏈表實現的隊列 257 5.4.2 優先隊列 258 5.4.3 找出前k個*大的元素 261 5.5 堆棧 262 5.6 雙端隊列 264 5.7 散列表 268 5.7.1 快速查找的散列表 269 5.7.2 HashMap 272 5.7.3 應用散列表 276 5.7.4 開放式尋址 279 5.7.5 布隆過濾器 282 5.7.6 SimHash 284 5.8 圖 286 5.8.1 表示圖 287 5.8.2 遍歷圖 295 5.9 大數據 297 5.10 本章小結 297 第6章 算法 299 6.1 貪婪法 299 6.2 分治法 301 6.3 動態規劃 302 6.4 在中文分詞中使用動態規劃算法 303 6.5 本章小結 310 第7章 *長匹配分詞 311 7.1 正向*大長度匹配法 312 7.2 逆向*大長度匹配法 316 7.3 處理未登錄串 320 7.4 開發分詞 324 7.5 本章小結 326 第8章 概率語言模型的分詞方法 327 8.1 一元模型 328 8.2 整合基于規則的方法 334 8.3 表示切分詞圖 336 8.4 形成切分詞圖 342 8.5 數據基礎 344 8.5.1 文本形式的詞表 344 8.5.2 數據庫詞表 348 8.6 改進一元模型 349 8.7 二元詞典 352 8.8 完全二叉數組 357 8.9 三元詞典 360 8.10 N元模型 361 8.11 N元分詞 362 8.12 生成語言模型 368 8.13 評估語言模型 369 8.14 概率分詞的流程與結構 370 8.15 本章小結 371 第9章 詞性標注 373 9.1 數據基礎 376 9.2 隱馬爾科夫模型 377 9.3 存儲數據 385 9.4 統計數據 390 9.5 整合切分與詞性標注 392 9.6 知識型詞性序列標注 396 9.7 本章小結 396 參考資源 397 后記 398
展開全部

Java中文文本信息處理-從海量到精準 作者簡介

羅剛,計算機軟件碩士,畢業于吉林工業大學。2005年創立北京盈智星科技發展有限公司,2008年聯合創立上海數聚軟件公司。獵兔搜索創始人,當前獵兔搜索在北京和上海以及石家莊均設有研發部。帶領獵兔搜索技術開發團隊先后開發出獵兔中文分詞系統、獵兔文本挖掘系統,智能垂直搜索系統以及網絡信息監測系統等,實現互聯網信息的采集、過濾、搜索和實時監測,其開發的搜索軟件日用戶訪問量達萬次以上。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 挤出机_橡胶挤出机_塑料挤出机_胶片冷却机-河北伟源橡塑设备有限公司 | 铣刨料沥青破碎机-沥青再生料设备-RAP热再生混合料破碎筛分设备 -江苏锡宝重工 | 青岛空压机,青岛空压机维修/保养,青岛空压机销售/出租公司,青岛空压机厂家电话 | 深圳快餐店设计-餐饮设计公司-餐饮空间品牌全案设计-深圳市勤蜂装饰工程 | 耐热钢-耐磨钢-山东聚金合金钢铸造有限公司| 振动筛-交叉筛-螺旋筛-滚轴筛-正弦筛-方形摇摆筛「新乡振动筛厂家」 | 冷却塔减速机器_冷却塔皮带箱维修厂家_凉水塔风机电机更换-广东康明冷却塔厂家 | 蜘蛛车-登高车-高空作业平台-高空作业车-曲臂剪叉式升降机租赁-重庆海克斯公司 | 机器视觉检测系统-视觉检测系统-机器视觉系统-ccd检测系统-视觉控制器-视控一体机 -海克易邦 | 青岛美佳乐清洁工程有限公司|青岛油烟管道清洗|酒店|企事业单位|学校工厂厨房|青岛油烟管道清洗 插针变压器-家用电器变压器-工业空调变压器-CD型电抗器-余姚市中驰电器有限公司 | 骁龙云呼电销防封号系统-axb电销平台-外呼稳定『免费试用』 | 金属抛光机-磁悬浮抛光机-磁力研磨机-磁力清洗机 - 苏州冠古科技 | 宠物店加盟_宠物连锁店_开宠物店-【派多格宠物】 | 青州搬家公司电话_青州搬家公司哪家好「鸿喜」青州搬家 | 无锡网站建设_小程序制作_网站设计公司_无锡网络公司_网站制作 | 高温高压釜(氢化反应釜)百科 | 扬尘在线监测系统_工地噪声扬尘检测仪_扬尘监测系统_贝塔射线扬尘监测设备「风途物联网科技」 | MVE振动电机_MVE震动电机_MVE卧式振打电机-河南新乡德诚生产厂家 | 西宁装修_西宁装修公司-西宁业之峰装饰-青海业之峰墅级装饰设计公司【官网】 | 代理记账_免费注册公司_营业执照代办_资质代办-【乐财汇】 | 塑料薄膜_PP薄膜_聚乙烯薄膜-常州市鑫美新材料包装厂 | 山东臭氧发生器,臭氧发生器厂家-山东瑞华环保设备 | 首页-恒温恒湿试验箱_恒温恒湿箱_高低温试验箱_高低温交变湿热试验箱_苏州正合 | 安徽华耐泵阀有限公司-官方网站 安德建奇火花机-阿奇夏米尔慢走丝|高维|发那科-北京杰森柏汇 | 阜阳在线-阜阳综合门户| 自动部分收集器,进口无油隔膜真空泵,SPME固相微萃取头-上海楚定分析仪器有限公司 | 上海三信|ph计|酸度计|电导率仪-艾科仪器 | 昆明挖掘机修理厂_挖掘机翻新再制造-昆明聚力工程机械维修有限公司 | 广州迈驰新GMP兽药包装机首页_药品包装机_中药散剂包装机 | 搪瓷搅拌器,搪玻璃搅拌器,搪玻璃冷凝器_厂家-淄博越宏化工设备 | 山西3A认证|太原AAA信用认证|投标AAA信用证书-山西AAA企业信用评级网 | 酒店品牌设计-酒店vi设计-酒店标识设计【国际级】VI策划公司 | 半自动预灌装机,卡式瓶灌装机,注射器灌装机,给药器灌装机,大输液灌装机,西林瓶灌装机-长沙一星制药机械有限公司 | 耐火浇注料价格-高强高铝-刚玉碳化硅耐磨浇注料厂家【直销】 | 青岛代理记账_青岛李沧代理记账公司_青岛崂山代理记账一个月多少钱_青岛德辉财税事务所官网 | 传动滚筒,改向滚筒-淄博建凯机械科技有限公司 | 天长市晶耀仪表有限公司 | 新型锤式破碎机_新型圆锥式_新型颚式破碎机_反击式打沙机_锤式制砂机_青州建源机械 | 胃口福饺子加盟官网_新鲜现包饺子云吞加盟 - 【胃口福唯一官网】 | 橡胶接头_橡胶软接头_套管伸缩器_管道伸缩器厂家-巩义市远大供水材料有限公司 | 芝麻黑-芝麻黑石材厂家-永峰石业 |