AI 大模型之美
徐文浩
bothub 创始人
32335 人已学习
新⼈⾸单¥68
登录后,你可以任选4讲全文学习
课程目录
已完结/共 33 讲
AI 大模型之美
15
15
1.0x
00:00/00:00
登录|注册

27|从Midjourney开始,探索AI产品的用户体验

分析是否运用了社区、反馈、数据飞轮原则
分享AI应用中的优秀产品设计
搜索、推荐场景中隐式反馈应用
用户选择行为作为反馈
隐形操作帮助标注
用户标注优质图片数据
小尺寸图片快速生成
提供多张图片选择
图片生成过程可视化
Discord Bot状态更新
用户请求排队等待
批次处理与GPU利用率
show-case、daily-theme频道展示案例
老用户general频道展示优秀作品
共享内容教导新用户
新用户聊天室展示多样画作
搭建数据飞轮以迭代模型
给用户即时反馈
以用户社区作为入门教程
用户订阅模式,高年收入
小团队,高质量输出
无独立App,依赖Discord交互
思考题
数据飞轮快速迭代
及时反馈提升体验
技术限制与响应时间
用户社区降低上手门槛
设计原则
Midjourney案例分析
AI产品用户体验探索

该思维导图由 AI 生成,仅供参考

你好,我是徐文浩。
学到这里,这个课程终于到了尾声。过去的二十多讲里,我们围绕着文本、语音、视频、图像体验了大量的 AI 应用场景。不过在这些场景里,我们还只是通过撰写代码体验了 AI 的能力。那么,如果我们今天想通过学习到的这些知识,开发一个真正的 AI 应用,需要注意些什么呢?我们是只需要简单地给我们的 Python 代码封装一个对话框一样的用户界面就可以了吗?
如果你有这样的疑惑,那请一定要坚持学完这最后一讲。我们一起来看看 Midjourney 这个 AI 画画的应用是怎么做的。它在整个应用的体验里考虑了哪些设计原则?毕竟,Midjourney 在过去一年里可谓是创造了一个 AI 产品的奇迹。它没有独立的 App,完全依赖 Discord 这个语音社区聊天工具和用户交互。团队只有十几个人,但是出图的质量始终领先于有整个开源社区支持的 Stable Diffusion。没有外部融资,却完全靠用户订阅获取了 1 亿美元的年收入。
无论从哪个角度来看,Midjourney 都是一个值得研究的 AI 产品。在它所有的产品设计里,我认为有三个要点是今天所有的 AI 应用都应该借鉴的,那就是以用户社区作为入门教程、给用户即时反馈以及搭建数据飞轮以迭代模型。下面我们一个一个来看。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

Midjourney是一个AI产品,通过其用户体验设计,为其他AI产品提供了可借鉴的设计原则。该产品以用户社区作为入门教程,通过Discord频道让用户分享和观赏不同风格的画作,降低了用户上手门槛。在面临技术限制时,Midjourney通过及时反馈提升用户体验,让用户在等待生成图片的过程中能够看到任务进展,并提供多张图片供用户选择,弥补了算法生成图像可控性的不足。这些设计原则可以为其他AI应用提供借鉴,帮助其提升用户体验。 Midjourney通过用户操作隐式反馈,如点击“刷新”按钮重新生成图片或选择“变形”图片,从而获取用户对图片质量的隐含标注,为产品提供了海量的用户标注数据。这种数据飞轮的建立,为产品提供了高质量的数据集,进而训练出更好的模型,吸引更多用户,形成良性循环。这种“隐式”反馈信息的使用对于AI应用至关重要,能够带来意想不到的产品优势。 在AIGC类应用中,用户社区、及时反馈以及建立数据飞轮是必不可少的组成部分。这些原则为AI产品设计提供了有益的参考,帮助产品提升用户体验,吸引更多用户,形成良性循环。如果读者决定开发类似应用,应该重视这三个元素,以提升产品竞争力。 这篇文章总结了Midjourney的用户体验设计原则,以及AIGC产品设计的核心原则,为读者提供了有益的参考。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《AI 大模型之美》
新⼈⾸单¥68
立即购买
登录 后留言

全部留言(12)

  • 最新
  • 精选
  • Toni
    今天的第27课是徐文浩老师的 "AI 大模型之美"系列讲座的收官之作,感觉来得很突然,都因心中还有期待。徐老师用短短的27讲,通过精心的安排,将 AI世界的各个触角展现在我们眼前,直接上手的实例体验更有拨云见日之功效。当我们亲手推开那一扇扇大门时,神秘变成自然。 Embedding 是一条线,它将大数据,多模态,深度学习,神经网络,机器学习,大语言模型都串了起来; 随之而来的各类算法,分类,递归,决策,都在忙着处理这些 Embedding,"跳出来"的情感分析,广告推送,"智能"聊天就是再自然不过的事了。 老师在"上手课"之后的第二节就引出了 OpenAI 的 Embedding,寥寥几行代码,其在零启动情感分析上的威力就显露无疑。 Embedding 将"万事万物"映射到高维空间,维数的增加标志着对事物描述得更细,但带来的是对算力需求的急剧增加,处理过程变慢。再经过多层迭代,反馈激励,最后连 AI 自己都说不清是怎么 Embedding的了。 既然是 Embedding, AI 就不可能做到尽善尽美,理解。人也无完人,更不要说一个"失败的触痛"极有可能成为另一个成功的"触发器"。 感谢徐文浩老师的这门课,给出了很多实例,包括对开源库的介绍,及相关重要论文的索引,同时还引发了更多的思考,再次感谢。

    作者回复: 感谢支持!

    2023-05-12归属地:瑞士
    21
  • Toni
    当ChatGPT4 还在玩waitlist, 新的挑战者已横空出世(https://www.anthropic.com/index/100k-context-windows)。 Claude-100k 以一次性读取10万个token,将GPT4甩开3倍有余。这意味着什么呢? 在第六课时我们学的聊天机器人,为了让它记住之前聊的问题,要将以前的聊天内容当作下一轮对话的prompt,再喂给OpenAI,但很快prompt 中的 token 数就超过了最高限制,我们只能裁去之前的内容,或小结,以满足token 数限制的要求,一般几轮对话下来聊天机器人就忘了之前的内容了,这就是应用中的痛点。第七节给文章做总结,第十六节用Langchain 给AI上手段使其"记忆力"变长,到第十九节用Whisper 语音转文字,将大段的录音裁成几段才能处理,都是那个痛点: token 数限制。 Claude-100k 一次性读取10万个token,意味着聊天机器人通天聊几天的内容都记得,7,8万字的书一次性提取中心思想,6小时的音频文件无须裁成数个小文件了。 "好事者"已经在用 Claude-100k 分析拆解 ChatGPT4,看看它到底是个什么"鬼",因为 ChatGPT4 也无法了解其自身。 我们在见证历史。

    作者回复: 👍

    2023-05-12归属地:瑞士
    9
  • zhihai.tu
    谢谢徐老师,墨问西东集训班再见。

    作者回复: 到时候见!

    2023-05-14归属地:上海
  • 风的叹息
    确实很棒的课程,意犹未尽啊,老师后续可否对关键的某些技术节点可以加更一二,期待解读

    作者回复: 要看时间安排,如果抽得出空的确想要再补充一些新内容。

    2023-05-12归属地:广东
  • Santiago
    感谢老师的课程,极大的拓宽了我的知识面,也对AIGC有了一个很好的认识与理解,再次感谢徐老师!
    2023-05-13归属地:山西
    2
  • JonSlow
    微软这几天刚发布的 bing.com/create,体验也挺不错,推荐各位同学上手试试
    2023-05-12归属地:北京
    1
  • Geek_d54869
    感谢精彩课程讲解和分享,产品人收益良多~
    2023-10-10归属地:北京
  • Geek_f92fa7
    搭建数据飞轮这里,个人部署模型后,也可以收集使用日志数据,来获取优质图片数据来迭代模型呀。
    2023-08-15归属地:新加坡
  • 胡萝卜
    qq频道接入了midjourney
    2023-05-18归属地:上海
    1
  • 芋头
    课程学完了,感谢徐老师带我进入AI这扇神秘的大门,感谢老师为我解惑
    2023-05-18归属地:广东
收起评论
显示
设置
留言
12
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部