中图网(原中国图书网):网上书店,中文字幕在线一区二区三区,尾货特色书店,中文字幕在线一区,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
AI圖像生成核心技術與實踐

包郵 AI圖像生成核心技術與實踐

作者:南柯
出版社:人民郵電出版社出版時間:2024-10-01
開本: 16開 頁數: 158
中 圖 價:¥52.0(7.4折) 定價  ¥69.8 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

AI圖像生成核心技術與實踐 版權信息

AI圖像生成核心技術與實踐 本書特色

如果你已經掌握了一些圖像生成的零散知識,但是想要形成完整的知識體系

如果你好奇Midjourney、Stable Diffusion、DALL·E等模型,在實現上有何不同

如果你想自己動手訓練一個圖像生成模型





那么可以讀一讀這本書,系統、快速地構建AI圖像生成的知識脈絡!

AI圖像生成核心技術與實踐 內容簡介

本書以AI圖像生成為主線,串聯講解了Stable Diffusion、DALL·E、Imagen、Midjourney等模型的技術方案,并帶著讀者訓練一個自己專屬的AI圖像生成模型。

本書共6章。第1章先介紹身邊的AIGC產品,再講解AI圖像生成相關的深度學習基礎知識,包括神經網絡和多模態模型的基礎知識。第2章講解AI圖像生成技術,從VAE到GAN到基于流的模型再到擴散模型的演化,并詳細介紹擴散模型的算法原理和組成模塊。第3章講解Stable Diffusion模型的核心技術。第4章講解DALL·E 2、Imagen、DeepFloyd和Stable Diffusion圖像變體模型的核心技術。第5章講解Midjourney、SDXL和DALL·E 3的核心技術。第6章是項目實戰,使用LoRA技術對Stable Diffusion模型進行微調,得到特定風格的AI圖像生成模型。

AI圖像生成核心技術與實踐 目錄

第 1章 AIGC基礎 1

1.1 身邊的AIGC 1

1.1.1 圖像生成和編輯類工具 1

1.1.2 文字提效類工具 2

1.1.3 音頻創作類工具 4

1.2 神經網絡 4

1.2.1 人工神經元 5

1.2.2 激活函數 6

1.2.3 人工神經網絡 7

1.2.4 損失函數 9

1.2.5 優化器 9

1.2.6 卷積神經網絡 10

1.3 多模態模型 13

1.3.1 認識模態 14

1.3.2 典型多模態模型 15

1.3.3 參數量 16

1.3.4 計算量 17

1.4 小結 17

第 2章 圖像生成模型:GAN和擴散模型 19

2.1 圖像生成模型的技術演化 19

2.1.1 第 一代圖像生成模型:VAE 20

2.1.2 第二代圖像生成模型:GAN 20

2.1.3 第三代圖像生成模型:基于流的模型 21

2.1.4 第四代圖像生成模型:擴散模型 21

2.1.5 第五代圖像生成模型:自回歸模型 22

2.2 “舊畫師”GAN 22

2.2.1 生成對抗原理 22

2.2.2 生成能力的進化 24

2.2.3 GAN時代的“圖生圖” 28

2.2.4 GAN的技術應用 30

2.3 “新畫師”擴散模型 31

2.3.1 加噪過程:從原始圖像到噪聲圖 32

2.3.2 去噪過程:從噪聲圖到清晰圖像 33

2.3.3 訓練過程和推理過程 35

2.3.4 擴散模型與GAN 36

2.4 擴散模型的U-Net模型 37

2.4.1 巧妙的U形結構 37

2.4.2 損失函數設計 41

2.4.3 應用于擴散模型 43

2.5 擴散模型的采樣器 43

2.5.1 采樣器背后的原理 44

2.5.2 如何選擇采樣器 45

2.6 訓練一個擴散模型 46

2.6.1 初探擴散模型:輕松入門 46

2.6.2 深入擴散模型:定制藝術 50

2.7 小結 52

第3章 Stable Diffusion的核心技術 53

3.1 圖像的“壓縮器”VAE 53

3.1.1 從AE到VAE 54

3.1.2 圖像插值生成 58

3.1.3 訓練“餐廳評論機器人” 60

3.1.4 VAE和擴散模型 61

3.2 讓模型“聽話”的CLIP 62

3.2.1 連接兩種模態 62

3.2.2 跨模態檢索 64

3.2.3 其他CLIP模型 67

3.2.4 CLIP和擴散模型 68

3.3 交叉注意力機制 69

3.3.1 序列、詞符和詞嵌入 69

3.3.2 自注意力與交叉注意力 71

3.3.3 多頭注意力 72

3.4 Stable Diffusion是如何工作的 77

3.4.1 Stable Diffusion的演化之路 77

3.4.2 潛在擴散模型 78

3.4.3 文本描述引導原理 80

3.4.4 U-Net模型實現細節 82

3.4.5 反向描述詞與CLIP Skip 86

3.4.6 “圖生圖”實現原理 87

3.5 小結 90

第4章 DALL·E 2、Imagen、DeepFloyd和Stable Diffusion圖像變體的

核心技術 91

4.1 里程碑DALL·E 2 91

4.1.1 DALL·E 2的基本功能概覽 91

4.1.2 DALL·E 2背后的原理 94

4.1.3 unCLIP:圖像變體的魔法 97

4.1.4 DALL·E 2的算法局限性 97

4.2 Imagen和DeepFloyd 98

4.2.1 Imagen vs DALL·E 2 98

4.2.2 Imagen的算法原理 99

4.2.3 文本編碼器:T5 vs CLIP 100

4.2.4 動態閾值策略 103

4.2.5 開源模型DeepFloyd 104

4.2.6 升級版Imagen 2 107

4.3 Stable Diffusion圖像變體 107

4.3.1 “圖生圖”vs圖像變體 107

4.3.2 使用Stable Diffusion圖像變體 108

4.3.3 探秘Stable Diffusion圖像變體模型背后的算法原理 110

4.4 小結 112

第5章 Midjourney、SDXL和DALL·E 3的核心技術 113

5.1 推測Midjourney的技術方案 113

5.1.1 Midjourney的基本用法 113

5.1.2 各版本演化之路 114

5.1.3 技術方案推測 117

5.2 SDXL的技術方案與使用 120

5.2.1 驚艷的繪圖能力 120

5.2.2 使用級聯模型提升效果 122

5.2.3 更新基礎模塊 123

5.2.4 使用SDXL模型 124

5.3 更“聽話”的DALL·E 3 126

5.3.1 體驗DALL·E 3的功能 126

5.3.2 數據集重新描述 127

5.3.3 生成數據有效性 128

5.3.4 數據混合策略 129

5.3.5 基礎模塊升級 131

5.3.6 擴散模型解碼器 133

5.3.7 算法局限性 133

5.4 小結 134

第6章 訓練自己的Stable Diffusion 135

6.1 低成本訓練神器LoRA 135

6.1.1 LoRA的基本原理 135

6.1.2 LoRA的代碼實現 136

6.1.3 用于圖像生成任務 138

6.2 Stable Diffusion WebUI體驗圖像生成 139

6.2.1 本地AI圖像生成模型 140

6.2.2 開源社區中的模型 142

6.2.3 體驗AI圖像生成功能 143

6.2.4 將多個模型進行融合 144

6.2.5 靈活的LoRA模型 146

6.3 Stable Diffusion代碼實戰 150

6.3.1 訓練數據準備 151

6.3.2 基礎模型的選擇與使用 154

6.3.3 一次完整的訓練過程 155

6.4 小結 157
展開全部

AI圖像生成核心技術與實踐 作者簡介

南柯,某頭部互聯網公司 AIGC 團隊技術負責人,高級算法專家,極客時間“AI 繪畫核心技術與實戰”專欄作者,擁有十多年計算機視覺領域從業經驗,帶領團隊推動多模態生成,尤其是 AI 圖像生成與編輯、多模態大語言模型、數字人等熱點方向的技術建設。在 ICCV 和AAAI 年會等 AI 領域頂級會議上發表過多篇論文,擁有 100 多項專利。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 3dmax渲染-效果图渲染-影视动画渲染-北京快渲科技有限公司 | 2025第九届世界无人机大会 | 超声波清洗机-超声波清洗设备定制生产厂家 - 深圳市冠博科技实业有限公司 | 喷漆房_废气处理设备-湖北天地鑫环保设备有限公司 | 合肥白癜风医院_合肥治疗白癜风医院_合肥看白癜风医院哪家好_合肥华研白癜风医院 | 医用空气消毒机-医用管路消毒机-工作服消毒柜-成都三康王 | 旅游规划_旅游策划_乡村旅游规划_景区规划设计_旅游规划设计公司-北京绿道联合旅游规划设计有限公司 | 电缆隧道在线监测-智慧配电站房-升压站在线监测-江苏久创电气科技有限公司 | 芝麻黑-芝麻黑石材厂家-永峰石业| 波纹补偿器_不锈钢波纹补偿器_巩义市润达管道设备制造有限公司 | 广州中央空调回收,二手中央空调回收,旧空调回收,制冷设备回收,冷气机组回收公司-广州益夫制冷设备回收公司 | 滁州高低温冲击试验箱厂家_安徽高低温试验箱价格|安徽希尔伯特 | 便携式表面粗糙度仪-彩屏硬度计-分体式粗糙度仪-北京凯达科仪科技有限公司 | 纯水电导率测定仪-万用气体检测仪-低钠测定仪-米沃奇科技(北京)有限公司www.milwaukeeinst.cn 锂辉石检测仪器,水泥成分快速分析仪-湘潭宇科分析仪器有限公司 手术室净化装修-手术室净化工程公司-华锐手术室净化厂家 | 福建省教师资格证-福建教师资格证考试网| 合肥展厅设计-安徽展台设计-合肥展览公司-安徽奥美展览工程有限公司 | 曙光腾达官网-天津脚手架租赁-木板架出租-移动门式脚手架租赁「免费搭设」 | 气体检测仪-氢气检测仪-可燃气体传感器-恶臭电子鼻-深国安电子 | 华夏医界网_民营医疗产业信息平台_民营医院营销管理培训 | 厦门网站建设_厦门网站设计_小程序开发_网站制作公司【麦格科技】 | 硬质合金模具_硬质合金非标定制_硬面加工「生产厂家」-西迪技术股份有限公司 | 365文案网_全网创意文案句子素材站| 谷梁科技| 户外健身路径_小区健身器材_室外健身器材厂家_价格-浩然体育 | 【法利莱住人集装箱厂家】—活动集装箱房,集装箱租赁_大品牌,更放心 | 臻知网大型互动问答社区-你的问题将在这里得到解答!-无锡据风网络科技有限公司 | 南京种植牙医院【官方挂号】_南京治疗种植牙医院那个好_南京看种植牙哪里好_南京茀莱堡口腔医院 尼龙PA610树脂,尼龙PA612树脂,尼龙PA1010树脂,透明尼龙-谷骐科技【官网】 | 玻璃钢型材-玻璃钢风管-玻璃钢管道,生产厂家-[江苏欧升玻璃钢制造有限公司] | 北京翻译公司_同传翻译_字幕翻译_合同翻译_英语陪同翻译_影视翻译_翻译盖章-译铭信息 | 办公室装修_上海办公室设计装修_时尚办公新主张-后街印象 | 网站建设,北京网站建设,北京网站建设公司,网站系统开发,北京网站制作公司,响应式网站,做网站公司,海淀做网站,朝阳做网站,昌平做网站,建站公司 | 执业药师报名时间,报考条件,考试时间-首页入口 | 长城人品牌官网| 锥形螺带干燥机(新型耙式干燥机)百科-常州丰能干燥工程 | 北京公积金代办/租房发票/租房备案-北京金鼎源公积金提取服务中心 | 东莞动力锂电池保护板_BMS智能软件保护板_锂电池主动均衡保护板-东莞市倡芯电子科技有限公司 | 诺冠气动元件,诺冠电磁阀,海隆防爆阀,norgren气缸-山东锦隆自动化科技有限公司 | 辐射色度计-字符亮度测试-反射式膜厚仪-苏州瑞格谱光电科技有限公司 | 滑板场地施工_极限运动场地设计_滑板公园建造_盐城天人极限运动场地建设有限公司 | 海德莱电力(HYDELEY)-无功补偿元器件生产厂家-二十年专业从事电力电容器 | X光检测仪_食品金属异物检测机_X射线检测设备_微现检测 |