-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
數據科學與工程技術叢書Python文本分析(原書第2版) 版權信息
- ISBN:9787111666776
- 條形碼:9787111666776 ; 978-7-111-66677-6
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
數據科學與工程技術叢書Python文本分析(原書第2版) 本書特色
Red Hat數據科學家撰寫,全面系統闡釋Python文本分析的相關基礎知識、實用技術及實踐
數據科學與工程技術叢書Python文本分析(原書第2版) 內容簡介
本書遵循結構化和綜合性的方法,介紹了文本和語言語法、結構和語義的基礎概念和不錯概念。從自然語言和Python的基礎開始,進而學習優選的分析理念和機器學習概念。全面提供了自然語言處理(NLP)和文本分析的主要概念和技術。包含了豐富的真實案例實現技術,例如構建分類新聞文章的文本分類系統,使用主題建模和文本摘要分析app或游戲評論,進行熱門電影概要的聚類分析和電影評論的情感分析。介紹了基于Python和流行NLP開源庫和文本分析實用工具,如自然語言工具包(nltk)、gensim、scikit-learn、spaCy和Pattern。
數據科學與工程技術叢書Python文本分析(原書第2版) 目錄
推薦序
前言
致謝
作者簡介
技術審校者簡介
第1章 自然語言處理基礎
1.1 自然語言
1.1.1 什么是自然語言
1.1.2 語言哲學
1.1.3 語言習得和用法
1.2 語言學
1.3 語言句法和結構
1.3.1 單詞
1.3.2 短語
1.3.3 從句
1.3.4 語法
1.3.5 語序類型學
1.4 語言語義
1.4.1 詞匯語義關系
1.4.2 語義網絡和模型
1.4.3 語義表示
1.5 文本語料庫
1.5.1 文本語料庫標注及使用
1.5.2 流行的語料庫
1.5.3 訪問文本語料庫
1.6 自然語言處理
1.6.1 機器翻譯
1.6.2 語音識別系統
1.6.3 問答系統
1.6.4 上下文識別與消解
1.6.5 文本摘要
1.6.6 文本分類
1.7 文本分析
1.8.機器學習
1.9 深度學習
1.1 0本章小結
第2章 Python自然語言處理
2.1 了解Pvthon
2.2 Python之禪
2.3 應用:何時使用Pymon
2.4 缺點:何時不用Pymon
2.5 Python的實現和版本
2.6 建立強大的Python環境
2.6.1 用哪個Python版本
2.6.2 用哪個操作系統
2.6.3 集成開發環境
2.6.4 環境設置
2.6.5 軟件包管理
2.6.6 虛擬環境
2.7 Python語法和結構
2.8 使用文本數據
2.8.1 字符串文字
2.8.2 表示字符串
2.8.3 字符串操作和方法
2.9 基本的文本處理和分析:綜合案例
2.1 0自然語言處理框架
2.1 1本章小結
第3章 處理和理解文本
3.1 文本預處理和整理
3.1.1 刪除HTML標簽
3.1.2 文本標記解析
3.1.3 刪除重音字符
3.1.4 擴展縮寫詞
3.1.5 刪除特殊字符
3.1.6 大小寫轉換
3.1.7 文本校正
3.1.8 詞干提取
3.1.9 詞形還原
3.1.10 刪除停用詞
3.1.11 將以上整合在一起——構建文本規范器
3.2 理解文本句法和結構
3.2.1 安裝必要的依賴項
3.2.2 機器學習的重要概念
3.2.3 詞性標注
3.2.4 淺層解析或分塊
3.2.5 依存關系解析
3.2.6 成分結構解析
3.3 本章小結
……
第4章 用于文本表示的特征工程
第5章 文本分類
第6章 文本摘要和主題模型
第7章 文本相似度和聚類
第8章 語義分析
第9章 情感分析
第10章 深度學習的前景
數據科學與工程技術叢書Python文本分析(原書第2版) 作者簡介
迪潘簡·薩卡爾(Dianjan Sarkar)是紅帽(Red Hat)公司的數據科學家、暢銷書作者、顧問和培訓師。他曾在多家初創公司以及《財富》500強公司(如英特爾)任職并提供咨詢服務,主要致力于利用數據科學、高級分析、機器學習和深度學習來構建大規模智能系統。他擁有數據科學和軟件工程專業的碩士學位,是自學教育和大規模開放在線課程的堅定支持者。他目前涉足開源產品領域,致力于提高全球開發人員的生產力。 閆龍川,碩士,國家電網公司信息通信分公司高級工程師,信息通信技術專家,主要從事電力信息通信系統運行管理工作,研究興趣包括深度學習、強化學習、自然語言處理、云計算及數據中心管理等。 高德荃,博士,國家電網公司信息通信分公司高級工程師,主要從事電力信息通信系統運行分析工作,研究興趣包括機器學習與數據科學、地理空間分析等。 李君婷,碩士,國家電網公司信息通信分公司工程師,主要從事電力信息通信運維數據統計分析、項目管理等工作,研究興趣包括機器學習、數據挖掘、顛覆性創新等。
- >
李白與唐代文化
- >
大紅狗在馬戲團-大紅狗克里弗-助人
- >
隨園食單
- >
伯納黛特,你要去哪(2021新版)
- >
巴金-再思錄
- >
經典常談
- >
羅曼·羅蘭讀書隨筆-精裝
- >
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)