第1章 我们为什么要关注AIGC 1.1 从人工智能到人工智能生成内容 1.2 巨头如是说 1.2.1 国外“大厂”在AIGC领域的布局 1.2.2 国内“大厂”在AIGC领域的布局 1.3 资本狂潮 1.4 异军突起的独角兽企业 1.4.1 OpenAI 1.4.2 Stability AI 1.4.3 Scale AI 1.5 行业“大牛”:谁是下一个“乔布斯” 第2章 AIGC相关技术介绍 2.1 规则系统 2.2 变分自编码器 2.3 生成对抗网络 2.3.1 GAN模型训练原理 2.3.2 CGAN模型 2.3.3 基于模型架构的衍生 2.3.4 基于损失函数的衍生 2.3.5 图像生成领域的衍生 2.4 Transformer模型架构 2.5 基于Transformer模型架构的LLM 2.5.1 基于编码器的LLM 2.5.2 基于解码器的LLM 2.5.3 基于编码器和解码器的LLM 2.5.4 BERT模型与GPT模型对比 2.6 扩散模型 2.6.1 扩散模型原理 2.6.2 DALL?E 2模型 2.6.3 Stable Diffusion模型 2.7 其他模型 2.8 LLM的前景光明 第3章 下笔如有神:文本类AIGC 3.1 何为“智能” 3.2 拆解文本生成技术原理 3.2.1 1950—1970年,NLP初露锋芒 3.2.2 1980—2010年,NLP的寒冬与机遇并存 3.2.3 2010—2019年,技术迸发与沉淀 3.2.4 2019年至今,AIGC进入寻常百姓家 3.3 文本类AIGC在传媒场景中的应用 3.3.1 社交媒体文案:Jasper 3.3.2 新闻写作:Quakebot、CNET 3.3.3 剧本撰写:海马轻帆 3.4 文本类AIGC在教育场景中的应用 3.4.1 文章撰写:EssayGenuis 3.4.2 出题和做题:高校联合团队开发的AI程序 3.4.3 青少年教育:Cognii 3.5 文本类AIGC在办公场景中的应用 3.5.1 搜索引擎优化:Kafkai 3.5.2 营销文案:Copysmith 3.5.3 电子邮件:Compose.ai 3.5.4 代码撰写:GitHub Copilot 3.6 文本类AIGC的其他热门场景 3.6.1 AI聊天机器人 3.6.2 AIGC搜索引擎:Perplexity AI 3.7 万众瞩目的ChatGPT 3.7.1 ChatGPT是什么 3.7.2 ChatGPT的海量应用场景 3.7.3 GPT-4模型:截至2023年3月*强的AI模型 3.7.4 ChatGPT对普通人意味着什么 3.8 文本类AIGC的未来 第4章 “声临其境”:声音类AIGC 4.1 从让机器开口说话开始 4.1.1 18至19世纪的尝试 4.1.2 20世纪30年代,语音合成技术的萌芽 4.1.3 20世纪50年代,计算机语音合成系统的起源 4.1.4 20世纪末,传统的语音合成方法 4.1.5 2016年,AIGC打破语音合成技术的发展瓶颈 4.1.6 2017年,语音合成技术迎来研究热 4.2 音乐类AIGC 4.2.1 从留声机到个人计算机制作的电子音乐 4.2.2 早期的音乐类AIGC 4.2.3 端到端模型大展身手 4.2.4 歌声合成 4.2.5 音频延续 4.3 人声类AIGC 4.3.1 变声器 4.3.2 语音助手 4.3.3 有声内容创作 4.3.4 智能电话机器人 4.3.5 教育 4.3.6 无障碍沟通 4.4 声音类AIGC的未来 4.4.1 业内观点 4.4.2 声音类AIGC的局限性和未来展望 第5章 如你所见:图片类AIGC 5.1 从计算机艺术到算法模型艺术 5.1.1 20世纪70年代,艺术家的午夜花园 5.1.2 2012年,一次有突破意义的尝试:猫脸的识别与生成 5.1.3 2014年,GAN模型问世 5.1.4 2017年,梦始于Transformer模型 5.1.5 2021年,文本与图片进行匹配:CLIP模型和文字提示词 5.1.6 2020—2022年,图片生成技术开启AI绘画元年:扩散模型 5.2 AI绘画 5.2.1 主流的AI绘画工具介绍 5.2.2 生成图片类AIGC的方式 5.2.3 Prompt词组 5.3 图片处理 5.3.1 AI修图 5.3.2 图片增强 5.3.3 分割抠图 5.4 图片类AIGC的衍生应用:AI识图和AI鉴图 5.4.1 人脸和人体识别 5.4.2 通用图片识别 5.4.3 是否由AI绘画工具创作 5.5 实用、有趣的图片世界 5.5.1 头像生成 5.5.2 模拟场景 5.5.3 PPT生成 5.5.4 设计 5.5.5 稿件配图 5.5.6 更多场景 5.6 图片类AIGC的未来 5.6.1 局限性和发展预测 5.6.2 怎么看AI艺术 5.6.3 笔者的一些浅见 第6章 众所周知,视频是不能PS的:视频类AIGC 6.1 视频生成技术的发展历程 6.1.1 早期探索 6.1.2 2014—2016年,视频生成起步:无条件视频生成 6.1.3 2017年,潘多拉的魔盒:人像视频生成 6.1.4 2018—2019年,视频生成视频技术的突破 6.1.5 2021年,文本生成视频技术的发展 6.1.6 2022年,扩散模型进军视频生成领域 6.2 视频生成工具 6.2.1 数字人视频生成工具 6.2.2 视频编辑工具 6.2.3 文本生成视频工具 6.3 视频生成应用 6.3.1 高清内容生成 6.3.2 快速拆条和视频摘要生成 6.3.3 场景植入 6.3.4 视频卡通化 6.3.5 文本生成视频 6.3.6 数字人视频生成 6.3.7 人脸视频生成 6.4 数字人:仿生人与电子羊 6.5 视频类AIGC的未来 6.5.1 局限性 6.5.2 未来预测 第7章 AIGC的相关产业和生态发展 7.1 芯片:算力决定智力 7.1.1 在AIGC领域中,现在用什么芯片 7.1.2 随着AIGC的发展,对芯片会有什么新的需求 7.2 AIGC展示端口:AR/VR/MR/XR设备 7.2.1 AR设备 7.2.2 VR设备 7.3 模型类AIGC应用在元宇宙里自动化建模 7.3.1 拍视频就可以得到模型?基于视频自动化生成模型 7.3.2 元宇宙版的神笔马良,基于文本自动化生成三维模型 7.3.3 穿越空间,虚拟直播空间建设 7.3.4 元宇宙的化身——数字人生成技术 7.3.5 把实物带到元宇宙中,基于三维激光扫描设备的文物逆向建模 7.4 AIGC应用的未来 第8章 AI文明的降临已开启*** 8.1 何谓内容 8.2 AIGC的版权争议 8.3 普通人的AIGC时代生存建议 8.3.1 生产力工具:“人工”+“智能”=*强“打工人” 8.3.2 做AIGC应用的老师,为人类的“群体智慧”做贡献 8.3.3 向AIGC应用学习逻辑,同时关注创新 后记