AI 绘画核心技术与实战
南柯
某头部大厂图像团队技术 leader,高级算法专家
6373 人已学习
新⼈⾸单¥59
登录后,你可以任选4讲全文学习
课程目录
已完结/共 36 讲
AI 绘画核心技术与实战
15
15
1.0x
00:00/07:42
登录|注册

开篇词|AI技术爆发,如何实现绘画模型自由?

讲述:潇然大小:7.04M时长:07:42
你好,我是南柯,非常欢迎你加入我的课程,与我一起探索 AI 绘画技术背后的奥秘。
先做个自我介绍,作为一名计算机视觉从业者,我一直活跃在 AI 绘画技术领域。这么多年的工作里,我在图像风格化、图像生成、数字人等技术方向积累了丰富经验。目前我在一家头部互联网公司工作,正带领我的团队全力推动多模态大模型领域的能力建设。
我们后面要讨论的 AI 绘画,是 AIGC 技术的一部分。AI 绘画正处在百花齐放的上升期,就在 2022 年,一系列的天才画师模型相继推出,比如 DALL-E 2、Imagen、Parti、Stable Diffusion 等。更让人兴奋的是,这些新技术并非昙花一现,而是为更多更出色的工作铺平了道路,比如 AI 绘画领域的 MidjourneyV5。
可以预见,在未来几年 AI 绘画模型的生成能力、编辑能力仍将持续演进。现在选择入场做 AI 绘画技术是一个好时机。

一起迎接 AI 绘画的浪潮

结合近期我的一些工作经历和线下交流经历,不难看到大家对 AI 绘画非常好奇。让我比较意外的一点就是,除了正在研发和探索 AI 绘画算法、应用的专业人士之外,很多算法工程师、产品经理、艺术创作者,甚至我的老板们,也非常热衷和我讨论 AI 绘画背后的技术原理和未来的发展趋势。
设计师朋友正在担心“卷不过” AI 画师。未来 AI 绘画工具的普及程度,差不多会和现在的 CAD 技术一样。如果不尽快掌握 AI 绘画工具,并把它融合到自己的个人风格,就要面临被 AI 绘画工具挑战的风险。
有多年工作经验的资深产品经理正在负责 AI 绘画项目,却发现自己几乎听不懂算法同学的讨论了。想要追问,却常常得到“产品不需要深入了解这个”的回应,这让他深感无奈。
即便是有基础的算法工程师、技术同学,也很容易发现过往的传统深度学习方法和 AI 新技术中间有很大的知识鸿沟。因为缺乏指导,最多只能调用现成的 AI 绘画模型简单玩玩,新技术的原理仍然还是黑盒。
就连投资人、CEO 这样的角色也在有意识地培养自己对于 AI 绘画技术原理的理解、能力边界的认识,闲暇时间会拉着一线同学请教相关知识。搞懂了 AI 绘画背后的逻辑,有助于他们从公司视角去调整下一步的产品战略。
我自己也常常思考类似的问题。
为什么像 Stable Diffusion 这样的 AI 绘画模型一出现,GAN 就显得黯然失色了?
随着 AI 绘画和 GPT 技术的不断突破,图像编辑未来的交互形式是怎样的?
Midjourney 靠 AI 绘画取得了巨大成功,他们可能采用了哪些独特的算法方案?
我能否训练一个自己专属的 AI 绘画模型,随心所欲创造富有创意的内容?
如果你也在脑子里也闪过类似想法,那加入我的专栏将会是一个绝佳的选择。在接下来的学习中,我们将一同揭开这些问题的答案,探索 AI 绘画技术的奥秘。

我们课程是怎么安排的?

不过,对于初学者来说,想要系统了解学习 AI 绘画并不容易,主要障碍包括后面这几方面。
没有合适的系统学习资料。网上随便搜到的资料过于零散,不够深入,更不要说建立自己的知识体系;而 AIGC 方向的论文啃起来也很晦涩,而且读论文的方式并不适合所有人。
止步简单体验,无法做进阶尝试。只能简单体验开源模型,无法更进一步理解 AI 模型的技术原理,那么自然也就没办法随心所欲地做能力扩展。
缺少从业级别的指导。接触不到企业级的 AI 绘画项目和技术,自己摸索制作的只是“玩具水准”,难以达到各种 APP 上看到的从业者实现出的效果。
为了摆脱上述困境,这门课程将理论与实战相结合,在帮你搞懂 AI 绘画技术原理的基础上,通过多次实战课将 AI 绘画转化为你自己的工具。
具体来说,在这门课程中我们要一起经历四个阶段。
首先是热身阶段,相当于 AI 绘画旅程中的“新手村”,我会引领你熟悉各种令人着迷的免费开源 AI 绘画工具和模型,感受超参数在效果中的差异。此外,我们还会探索 Stable Diffusion 和 WebUI 的来龙去脉,一起安装和部署 WebUI,探索 AI 绘画的无限潜能。
接下来的基础篇,我会为你夯实 AI 绘画技术的基本原理,让你真正了解 AI 算法从业者需要掌握的理论技术基础,理解图像生成如何从 GAN 过渡到扩散模型的全过程,并掌握扩散模型各个模块的算法原理。产品和设计同学固然可以跳过理论,直接到下一章,但如果想搞明白 AI 绘画背后的黑魔法,多少需要了解这一章的基础知识。
有了前面的基础,我们就可以运用已学内容来解读分析业界主流的 AI 绘画模型了。进阶篇里,DALL-E 2、Imagen、Stable Diffusion、DeepFloyd、Midjourney 等业界最新最火的模型都会涉及到。掌握了这些模型的设计原理,不但能让我们充分学习、发掘这些模型的长处为己所用,还能为我们训练自己的专属 AI 绘画模型、实现“模型自由”打下坚实基础。
在下面的图中,我整理了从 DALL-E 2 推出以来,AI 绘画领域一些有影响力的模型和算法。你可以点开查看。
了解了 AI 绘画的基本原理、常见模型方案,也熟悉了开源工具和代码仓的使用,下一步便是如何“炼丹”,即自己定义风格训练模型,完成类似于 AI 绘画这类的项目。
我们将一起完成 DreamBooth、LoRA 模型的训练,使用 ControlNet 精细化控制内容的生成,做出类似于 LensaAI 这样的相册类效果,借助 Stable Diffusion 给你的照片渲染出各色风格。经过这些实战课的洗礼,相信你对 AI 绘画的应用能力会得到质的飞跃。
下面,我为你梳理了一个简化的 AI 绘画知识体系图,也是这门课程涉及的全部知识点。这些概念、模型、算法、工具,乍一看好像是孤立的,但串联起来就是一张大网,能帮助我们在 AI 绘画的浪潮下释放创意、做出很多有意思的事情。

你能获得什么?

正如你看到的,AI 绘画是个很大的话题,背后涉及的理论体系非常庞杂,领域相关的论文浩如烟海,并且每周都还在大量涌现出新的研究工作。在我的职业生涯之初,经常用很多个周末去啃英文版原汁原味的算法书籍,日积月累有不少的收获,可是这种方法实践下来,也经常会发现一些知识晦涩难懂,花费了大量时间却收获甚微。
幸运的是,后来在工作中我遇到了很多良师益友,他们能够深入浅出、三言两语把知识点讲清楚,帮助我积累了很多有用的经验、少走了很多弯路。后来我也开始渐渐成为了别人请教的对象,比如我曾被邀请和一些艺术家、企业家分享对于 AI 绘画技术的理解与思考,碰撞出很多有趣的火花。
因此,极客时间邀请我开设这门课程的时候,我们一拍即合。我非常期待在这门课里,用最简单的描述和例子,帮助你理解那些晦涩难懂的公式和理论,系统入门 AI 绘画这个领域。
学完整个课程,我们最终的目的地是这样的:真正打开 AI 绘画领域的大门,理解 AI 绘画的黑魔法背后的支撑技术和算法原理,搭建起自己的知识体系,未来遇到新的 AI 绘画论文、代码、模型,也能举一反三。实战方面,让主流 AI 绘画工具成为我们发挥创意的强大助力,做出我们在各种 App 看到的、从业者实现出的商用级算法效果。
AI 绘画技术实战之旅即将开启,期待你的加入!
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

AI绘画技术的快速发展引发了人们对其潜力和应用的探讨。南柯作为计算机视觉专家,致力于推动多模态大模型领域的能力建设。他指出AI绘画正处在百花齐放的上升期,为更多出色的工作铺平了道路。然而,许多人对AI绘画的技术原理和未来发展趋势充满好奇。南柯的课程旨在帮助学习者系统了解AI绘画,并将其转化为个人工具。课程安排包括热身阶段、基础篇、进阶篇和实战课,旨在帮助学习者实现能力扩展。通过这门课程,学习者将能够在AI绘画的浪潮下释放创意,做出许多有趣的事情。南柯期待着学习者的加入,共同开启AI绘画技术实战之旅。

2023-07-1737人觉得很赞给文章提建议

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《AI 绘画核心技术与实战》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(23)

  • 最新
  • 精选
  • 听水的湖
    置顶
    你好,我是这门课的编辑小新,欢迎加入课程学习。 这门课程的实战课需要用到的工具包括WebUI(实战1)和Colab(实战2-6)。关于WebUI的安装,在第一讲中有分平台的解释,需要大家参考提供课程里的指引进行WebUI配置,需要注意,每个人在安装过程中也许会遇到一些独特的环境问题,建议多谷歌查查资料解决。 如果有更具体的问题也可以在01讲留言里提出,我们一起探讨,另外01里也有用户分享了自己的配置经验(01置顶留言处),可以参考。关于Colab的使用,在第3讲中会有介绍,实战篇2-6的实战代码,会在Colab中帮助大家进行配置。 鼓励大家踊跃留言,记录和分享收获,积极参与有助于提升学习效果(PS:这门课的头图就是AIGC绘图而来)。
    2023-07-18归属地:北京
    4
    4
  • null
    看了课程大纲,热血沸腾

    作者回复: 加油~ 共同进步

    2023-07-17归属地:福建
    4
    4
  • Mistletoe
    一直很想看AIGC相关的资料,但是也一直没有找到系统的东西。感谢老师分享!

    作者回复: 欢迎一起学习、探讨!

    2023-07-20归属地:广东
    2
  • neohope
    这个课程等了一个多月啦,加油!

    作者回复: 加油~ 欢迎加入课程一起探讨!

    2023-07-19归属地:上海
    2
  • 失落的走地鸡
    我是一个web程序员,购买学习课程的主要目的是开发一个类似妙鸭的应用,会python。为了达成目的,我需要学习什么技术栈?需要从机器学习、pyTorch开始学习吗?请南柯老师帮忙列出我的学习路径,感谢!

    作者回复: 你好。第23讲中我们会通过facechain来做实战,这是开源的“阉割版妙鸭相机”,可以在这一件中和我一起操作。如果想开发一个类似的应用并做一些算法微调,需要掌握python、pytorch、深度学习基本原理和AI绘画基础。更具体而言,完成我们课程的基础篇、经典解决方案篇后,深入探究diffusers代码仓中的LoRA训练,https://github.com/huggingface/diffusers/blob/main/examples/text_to_image/train_text_to_image_lora.py 充分掌握这份代码的细节应该可以达成你的目的。课程学习过程中遇到不懂的知识和概念做针对性学习。希望能帮助到你。

    2023-08-31归属地:安徽
    1
  • 🇨🇳🇩🇪Holger肥巴哥
    自己之前看网上零零碎碎的SD教程不但费时而且效果一般,终于等到极客时间的官方课程了,立个flag,希望能把课程认认真真啃三遍

    作者回复: 加油~ 也欢迎你在评论区多多分享心得。

    2023-08-07归属地:美国
    1
  • 里咯破
    请问需要什么基础才能看懂这门课?

    作者回复: 你好。这门课主要探讨AI绘画背后的核心技术,也会带着大家做一些有意思的AI绘画项目实战。学习这门课程,需要有一定的python基础(能够运行和修改python代码)和深度学习基础(了解卷积运算等基本概念)。当然,课程中遇到一些没有展开的基础知识点,也可以通过查阅资料来习得。希望能够帮助到你。

    2023-07-31归属地:广东
    1
  • 互联网砖瓦匠
    太好了,正发愁没有系统性资料学习呢,这就来课了哈哈。

    作者回复: 欢迎加入课程一起学习~

    2023-07-18归属地:北京
    1
  • 学习兔
    老范推荐,必属精品。

    编辑回复: 欢迎加入学习~

    2023-07-17归属地:广东
    1
  • 王晨宇
    内容很棒,已学习~~

    作者回复: 加油,一起学习,共同进步~

    2023-07-17归属地:北京
    1
收起评论
大纲
固定大纲
一起迎接 AI 绘画的浪潮
我们课程是怎么安排的?
你能获得什么?
显示
设置
留言
23
收藏
31
沉浸
阅读
分享
手机端
快捷键
回顶部