-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
從零構建大模型 算法、訓練與微調 版權信息
- ISBN:9787302685616
- 條形碼:9787302685616 ; 978-7-302-68561-6
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
從零構建大模型 算法、訓練與微調 內容簡介
本書是一本系統且實用的大模型構建指南,旨在引領讀者從基礎知識起步,逐步深入探索大模型的算法原理、訓練方法及微調技術。本書共12章,涵蓋了Transformer模型的基礎理論,如Seq2Seq模型、分詞、嵌入層和自注意力機制等關鍵概念;并深入剖析了GPT模型的核心實現與文本生成過程,以及BERT模型的預訓練和微調技術。同時,也對ViT(視覺Transformer)模型的架構、訓練方法,以及高階微調策略如Adapter Tuning和P-Tuning進行了詳盡講解。此外,還系統地介紹了數據處理、數據增強、模型性能優化(包括混合精度訓練和分布式訓練)、對比學習、對抗訓練、自適應優化器、動態學習率調度,以及模型蒸餾與剪枝技術等多個方面。*后,通過應用案例,展示了模型訓練和微調的完整流程,助力讀者將理論知識轉化為實踐技能。
全書注重理論與實踐的結合,適合希望系統掌握大模型構建、訓練和優化的研發人員、高校學生,也適合對自然語言處理、計算機視覺等領域的大模型開發有興趣的讀者。還可作為培訓機構和高校相關課程的教學用書。
- >
我從未如此眷戀人間
- >
朝聞道
- >
大紅狗在馬戲團-大紅狗克里弗-助人
- >
伊索寓言-世界文學名著典藏-全譯本
- >
苦雨齋序跋文-周作人自編集
- >
人文閱讀與收藏·良友文學叢書:一天的工作
- >
唐代進士錄
- >
上帝之肋:男人的真實旅程