27|从Midjourney开始,探索AI产品的用户体验
徐文浩
该思维导图由 AI 生成,仅供参考
你好,我是徐文浩。
学到这里,这个课程终于到了尾声。过去的二十多讲里,我们围绕着文本、语音、视频、图像体验了大量的 AI 应用场景。不过在这些场景里,我们还只是通过撰写代码体验了 AI 的能力。那么,如果我们今天想通过学习到的这些知识,开发一个真正的 AI 应用,需要注意些什么呢?我们是只需要简单地给我们的 Python 代码封装一个对话框一样的用户界面就可以了吗?
如果你有这样的疑惑,那请一定要坚持学完这最后一讲。我们一起来看看 Midjourney 这个 AI 画画的应用是怎么做的。它在整个应用的体验里考虑了哪些设计原则?毕竟,Midjourney 在过去一年里可谓是创造了一个 AI 产品的奇迹。它没有独立的 App,完全依赖 Discord 这个语音社区聊天工具和用户交互。团队只有十几个人,但是出图的质量始终领先于有整个开源社区支持的 Stable Diffusion。没有外部融资,却完全靠用户订阅获取了 1 亿美元的年收入。
无论从哪个角度来看,Midjourney 都是一个值得研究的 AI 产品。在它所有的产品设计里,我认为有三个要点是今天所有的 AI 应用都应该借鉴的,那就是以用户社区作为入门教程、给用户即时反馈以及搭建数据飞轮以迭代模型。下面我们一个一个来看。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
Midjourney是一个AI产品,通过其用户体验设计,为其他AI产品提供了可借鉴的设计原则。该产品以用户社区作为入门教程,通过Discord频道让用户分享和观赏不同风格的画作,降低了用户上手门槛。在面临技术限制时,Midjourney通过及时反馈提升用户体验,让用户在等待生成图片的过程中能够看到任务进展,并提供多张图片供用户选择,弥补了算法生成图像可控性的不足。这些设计原则可以为其他AI应用提供借鉴,帮助其提升用户体验。 Midjourney通过用户操作隐式反馈,如点击“刷新”按钮重新生成图片或选择“变形”图片,从而获取用户对图片质量的隐含标注,为产品提供了海量的用户标注数据。这种数据飞轮的建立,为产品提供了高质量的数据集,进而训练出更好的模型,吸引更多用户,形成良性循环。这种“隐式”反馈信息的使用对于AI应用至关重要,能够带来意想不到的产品优势。 在AIGC类应用中,用户社区、及时反馈以及建立数据飞轮是必不可少的组成部分。这些原则为AI产品设计提供了有益的参考,帮助产品提升用户体验,吸引更多用户,形成良性循环。如果读者决定开发类似应用,应该重视这三个元素,以提升产品竞争力。 这篇文章总结了Midjourney的用户体验设计原则,以及AIGC产品设计的核心原则,为读者提供了有益的参考。
仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《AI 大模型之美》,新⼈⾸单¥68
《AI 大模型之美》,新⼈⾸单¥68
立即购买
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(12)
- 最新
- 精选
- Toni今天的第27课是徐文浩老师的 "AI 大模型之美"系列讲座的收官之作,感觉来得很突然,都因心中还有期待。徐老师用短短的27讲,通过精心的安排,将 AI世界的各个触角展现在我们眼前,直接上手的实例体验更有拨云见日之功效。当我们亲手推开那一扇扇大门时,神秘变成自然。 Embedding 是一条线,它将大数据,多模态,深度学习,神经网络,机器学习,大语言模型都串了起来; 随之而来的各类算法,分类,递归,决策,都在忙着处理这些 Embedding,"跳出来"的情感分析,广告推送,"智能"聊天就是再自然不过的事了。 老师在"上手课"之后的第二节就引出了 OpenAI 的 Embedding,寥寥几行代码,其在零启动情感分析上的威力就显露无疑。 Embedding 将"万事万物"映射到高维空间,维数的增加标志着对事物描述得更细,但带来的是对算力需求的急剧增加,处理过程变慢。再经过多层迭代,反馈激励,最后连 AI 自己都说不清是怎么 Embedding的了。 既然是 Embedding, AI 就不可能做到尽善尽美,理解。人也无完人,更不要说一个"失败的触痛"极有可能成为另一个成功的"触发器"。 感谢徐文浩老师的这门课,给出了很多实例,包括对开源库的介绍,及相关重要论文的索引,同时还引发了更多的思考,再次感谢。
作者回复: 感谢支持!
2023-05-12归属地:瑞士21 - Toni当ChatGPT4 还在玩waitlist, 新的挑战者已横空出世(https://www.anthropic.com/index/100k-context-windows)。 Claude-100k 以一次性读取10万个token,将GPT4甩开3倍有余。这意味着什么呢? 在第六课时我们学的聊天机器人,为了让它记住之前聊的问题,要将以前的聊天内容当作下一轮对话的prompt,再喂给OpenAI,但很快prompt 中的 token 数就超过了最高限制,我们只能裁去之前的内容,或小结,以满足token 数限制的要求,一般几轮对话下来聊天机器人就忘了之前的内容了,这就是应用中的痛点。第七节给文章做总结,第十六节用Langchain 给AI上手段使其"记忆力"变长,到第十九节用Whisper 语音转文字,将大段的录音裁成几段才能处理,都是那个痛点: token 数限制。 Claude-100k 一次性读取10万个token,意味着聊天机器人通天聊几天的内容都记得,7,8万字的书一次性提取中心思想,6小时的音频文件无须裁成数个小文件了。 "好事者"已经在用 Claude-100k 分析拆解 ChatGPT4,看看它到底是个什么"鬼",因为 ChatGPT4 也无法了解其自身。 我们在见证历史。
作者回复: 👍
2023-05-12归属地:瑞士9 - zhihai.tu谢谢徐老师,墨问西东集训班再见。
作者回复: 到时候见!
2023-05-14归属地:上海 - 风的叹息确实很棒的课程,意犹未尽啊,老师后续可否对关键的某些技术节点可以加更一二,期待解读
作者回复: 要看时间安排,如果抽得出空的确想要再补充一些新内容。
2023-05-12归属地:广东 - Santiago感谢老师的课程,极大的拓宽了我的知识面,也对AIGC有了一个很好的认识与理解,再次感谢徐老师!2023-05-13归属地:山西2
- JonSlow微软这几天刚发布的 bing.com/create,体验也挺不错,推荐各位同学上手试试2023-05-12归属地:北京1
- Geek_d54869感谢精彩课程讲解和分享,产品人收益良多~2023-10-10归属地:北京
- Geek_f92fa7搭建数据飞轮这里,个人部署模型后,也可以收集使用日志数据,来获取优质图片数据来迭代模型呀。2023-08-15归属地:新加坡
- 胡萝卜qq频道接入了midjourney2023-05-18归属地:上海1
- 芋头课程学完了,感谢徐老师带我进入AI这扇神秘的大门,感谢老师为我解惑2023-05-18归属地:广东
收起评论