-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
自然語言處理實戰(預訓練模型應用及其產品化) 版權信息
- ISBN:9787111707912
- 條形碼:9787111707912 ; 978-7-111-70791-2
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
自然語言處理實戰(預訓練模型應用及其產品化) 本書特色
適讀人群 :對機器學習有所了解,并且使用過Python 以及NumPy、pandas 和matplotlib 等類庫。在過去幾年中,自然語言處理技術的受歡迎程度呈現“爆炸式”增長。盡管Google、Facebook、OpenAI等前沿公司繼續發布著規模更大的語言模型,但許多開發團隊仍在摸索著構建與時俱進的自然語言處理應用程序。本書將幫助你快速了解自然語言處理的新技術及未來發展趨勢。 通過閱讀本書,你將學習如何為組織中的實際應用程序構建、訓練和部署模型。作者使用強調現代自然語言處理*佳實踐的代碼和示例來指導你完成整個過程。 本書的主要內容包括: ?使用先進的自然語言處理模型(如BERT和GPT-3)來解決命名實體識別、文本分類、語義搜索和閱讀理解等自然語言處理任務。 ?開發性能可媲美甚至優于開箱即用系統的自然語言處理模型。 ?Transformer架構和現代技巧,比如席卷整個自然語言處理世界的遷移學習。 ?自然語言處理的工具和框架,包括spaCy、Hugging Face和fast.ai。 ?使用Python和PyTorch從頭開始構建自然語言處理任務流水線的核心部分,包括分詞器、向量嵌入和語言模型。 ?將你的模型從Jupyter Notebook中產品化,并學習如何在生產環境中部署、監控和維護它們。 “這本書富有啟發性。作者帶領你遨游于自然語言處理的復雜世界。每一章都讓你有所收獲。” ——Benjamin Muskalla 高級軟件工程師 Ankur A. Patel是Glean和Mellow的聯合創始人。Glean使用自然語言處理技術生成供應商的支出情報信息,Mellow為程序員提供自然語言處理的API。此前,Ankur曾領導過7Park Data、ThetaRay、R-Squared Macro、Bridgewater Associates(橋水聯合基金)和JPMorgan(摩根大通)的團隊。他也是Hands-On Unsupervised Learning Using Python一書的作者。 Ajay Uppili Arasanipalai是美國伊利諾伊大學的一名學生,也是人工智能研究機構Landskape AI的聯合創始人。作為伊利諾伊大學的ACM SIGAI分會的聯合主席,他為本科生組織了教育研討會和項目。Ajay撰寫了許多熱門文章,討論了*先進的深度學習技術。
自然語言處理實戰(預訓練模型應用及其產品化) 內容簡介
在過去幾年中,自然語言處理技術的受歡迎程度呈現“爆炸式”增長。盡管Google、Facebook、OpenAl等前沿公司繼續發布著規模更大的語言模型,但許多開發團隊仍在努力構建與時俱進的自然語言處理應用程序。本書將幫助你快速了解自然語言處理的新技術及未來發展趨勢。 通過閱讀本書,你將學習如何為組織中的實際應用程序構建、訓練和部署模型。作者使用突出現代自然語言處理很好實踐的代碼和示例指導你完成整個過程。 本書的主要內容包括: 使用優選的自然語言處理模型(如BERT和GPT-3)來解決命名實體識別、文本分類、語義搜索和閱讀理解等自然語言處理任務。 開發性能可媲美甚至優于開箱即用系統的自然語言處理模型。 了解Transformer架構和現代技巧,比如席卷整個自然語言處理世界的遷移學習。 熟悉自然語言處理的工具和框架,包括spaCy、Hugging Face和fast.ai。 使用Python和PyTorch從頭開始構建自然語言處理任務流水線的核心部分,包括分詞器、向量嵌入和語言模型。 將你的模型從Jupyter Notebook中產品化,并學習如何在生產環境中部署、監控和維護它們。
自然語言處理實戰(預訓練模型應用及其產品化) 目錄
**部分 浮光掠影
第1章 自然語言處理介紹11
1.1 什么是自然語言處理12
1.2 基本的自然語言處理19
1.3 總結38
第2章 Transformer和遷移學習40
2.1 利用fast.ai庫進行訓練41
2.2 利用Hugging Face系列庫進行推理54
2.3 總結60
第3章 NLP任務和應用程序61
3.1 預訓練語言模型61
3.2 遷移學習和微調62
3.3 NLP任務63
3.4 自然語言數據集65
3.5 NLP任務1:命名實體識別70
3.6 NLP任務2:文本分類84
3.7 總結92
第二部分 綱舉目張
第4章 分詞97
4.1 一個極簡的分詞器98
4.2 Hugging Face的分詞器100
4.3 搭建自己的分詞器103
4.4 總結106
第5章 向量嵌入:計算機如何“理解”單詞107
5.1 理解文本與讀取文本107
5.2 詞向量111
5.3 詞向量嵌入實踐116
5.4 非詞條的嵌入122
5.5 總結126
第6章 循環神經網絡和其他序列模型128
6.1 循環神經網絡130
6.2 長短期記憶網絡142
6.3 門控循環單元143
6.4 總結144
第7章 Transformer146
7.1 從頭開始構建Transformer146
7.2 注意力機制148
7.3 計算機視覺Transformer161
7.4 總結162
第8章 BERT方法論:博采眾長創新篇164
8.1 ImageNet164
8.2 通往NLP“ImageNet時刻”之路165
8.3 預訓練的詞向量嵌入166
8.4 序列模型170
8.5 循環神經網絡172
8.6 注意力機制176
8.7 Transformer架構178
8.8 NLP的“ImageNet時刻”181
8.9 總結184
第三部分 經世致用
第9章 工欲善其事,必先利其器187
9.1 深度學習框架188
9.2 可視化與實驗跟蹤193
9.3 AutoML196
9.4 機器學習基礎設施和計算198
9.5 邊緣/終端側推理201
9.6 云推理和機器學習即服務203
9.7 持續集成和持續交付205
9.8 總結205
第10章 可視化207
10.1 我們的**個Streamlit應用程序208
10.2 總結220
第11章 產品化222
11.1 數據科學家、工程師和分析師222
11.2 Databricks:你的統一數據分析平臺224
11.3 Databricks的安裝228
11.4 機器學習作業243
11.5 MLflow249
11.6 Databricks的替代品260
11.7 總結261
第12章 歸納提升263
12.1 *后十課263
12.2 *后的話268
附錄A 大規模訓練269
附錄B CUDA273
自然語言處理實戰(預訓練模型應用及其產品化) 作者簡介
安庫·A.帕特爾(Ankur A.Patel),是Glean和Mellow的聯合創始人。Glean使用自然語言處理技術生成供應商的支出情報信息,Mellow為程序員提供自然語言處理的API。此前,Ankur曾領導過7Park Data、 ThetaRay、R-SquaredMacro、Bridgewater Associates(橋水聯合基金)和JPMorgan(摩根大通)的團隊。他也是Hands-On Unsupervised Learning Using Python一書的作者。
- >
伯納黛特,你要去哪(2021新版)
- >
山海經
- >
人文閱讀與收藏·良友文學叢書:一天的工作
- >
二體千字文
- >
名家帶你讀魯迅:朝花夕拾
- >
苦雨齋序跋文-周作人自編集
- >
有舍有得是人生
- >
唐代進士錄