喜发新模型,却被众嘲是破产“前兆”!Stability AI “最强”模型人形绘制太“阴间”,网友:因为研发太讲武德
华卫 核子可乐

整理 | 华卫、核子可乐
6 月 12 日,Stability AI 推出了 Stable Diffusion 3 Medium,这家英国初创公司称其为“迄今为止最先进的文本到图像开放模型”。至关重要的是,该模型可以在消费级 PC、笔记本电脑等个人消费系统以及企业级 GPU 上运行时生成这些图像。
要体验 SD3 Medium,可使用 Stability Platform(https://platform.stability.ai/)上的 API,注册 Stable Assistant(https://stability.ai/stable-assistant)以获取三天免费试用,也可通过 Discord 体验 Stable Artisan(https://stability.ai/stable-artisan)。

据介绍,SD3 Medium 由 20 亿个参数组成,无需复杂的工作流程即可获得逼真的结果。 模型的大小也是 SD3 Medium 的核心亮点,该模型比许多 Stable Diffusion 3 模型都要小,后者的参数范围在 8 亿到 80 亿之间。
Stability 公司表示,其构建 SD3 Medium 来理解涉及空间关系、构图元素、动作和风格的复杂提示,它还能克服手部和面部常见的伪影和瑕疵。但意外的是, SD3 Medium 一经发布,却因手脚等人体部位的“奇怪”绘制引发了“群嘲”。
公开
同步至部落
取消
完成
0/2000
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结

1. Stability AI推出了Stable Diffusion 3 Medium,这是一款文本到图像开放模型,具有20亿个参数,可以在个人消费系统和企业级GPU上运行。 2. SD3 Medium的突破性特点包括出色的整体质量与照片级真实感、提示词理解、排版功能、资源高效和微调。 3. SD3 Medium在人体绘制方面引发了用户的嘲笑,因为其生成的人体图像在结构上表现出诡异扭曲的视觉效果。 4. 用户在Reddit上指出SD3 Medium在渲染人物,特别是在手、脚等肢体方面的离谱操作,导致图像合成质量下降。 5. SD3 Medium的人体绘制问题可能与Stability公司过滤训练数据中成人内容有关,导致模型无法准确生成人体解剖结构。 6. 模型预训练期间可能存在NSFW过滤器过于挑剔,排除了一些并不存在冒犯性的内容,导致模型无法准确描绘人体。 7. 研究人员指出,SD3 Medium的工作在不涉及人物的图片上表现正常,推测是过滤训练数据的NSFW过滤器敏感度过高,将所有人类图像都划入了NSFW范畴。 8. Stability公司强调安全、负责任的AI实践原则,并采取合理措施以防范恶意行为者对SD3 Medium的滥用行为。 9. Stability与英伟达和AMD开展合作,利用英伟达RTX GPU以及TensorRT增强全体Stable Diffusion模型的性能,AMD也优化了SD3 Medium的推理性能.
该试读文章来自《AI 前线》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论