喜发新模型，却被众嘲是破产“前兆”！Stability AI “最强”模型人形绘制太“阴间”，网友：因为研发太讲武德

华卫核子可乐

整理  |  华卫、核子可乐
6 月 12 日，Stability AI  推出了  Stable Diffusion 3 Medium，这家英国初创公司称其为“迄今为止最先进的文本到图像开放模型”。至关重要的是，该模型可以在消费级 PC、笔记本电脑等个人消费系统以及企业级 GPU 上运行时生成这些图像。
要体验 SD3 Medium，可使用 Stability Platform（https://platform.stability.ai/）上的 API，注册 Stable Assistant（https://stability.ai/stable-assistant）以获取三天免费试用，也可通过 Discord 体验 Stable Artisan（https://stability.ai/stable-artisan）。
据介绍，SD3 Medium  由  20  亿个参数组成，无需复杂的工作流程即可获得逼真的结果。  模型的大小也是 SD3 Medium  的核心亮点，该模型比许多  Stable Diffusion 3  模型都要小，后者的参数范围在  8  亿到  80  亿之间。
Stability  公司表示，其构建  SD3 Medium  来理解涉及空间关系、构图元素、动作和风格的复杂提示，它还能克服手部和面部常见的伪影和瑕疵。但意外的是， SD3 Medium  一经发布，却因手脚等人体部位的“奇怪”绘制引发了“群嘲”。

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
中文繁体
法语
德语
日语
韩语
俄语
西班牙语
阿拉伯语
解释
总结

1. Stability AI推出了Stable Diffusion 3 Medium，这是一款文本到图像开放模型，具有20亿个参数，可以在个人消费系统和企业级GPU上运行。 2. SD3 Medium的突破性特点包括出色的整体质量与照片级真实感、提示词理解、排版功能、资源高效和微调。 3. SD3 Medium在人体绘制方面引发了用户的嘲笑，因为其生成的人体图像在结构上表现出诡异扭曲的视觉效果。 4. 用户在Reddit上指出SD3 Medium在渲染人物，特别是在手、脚等肢体方面的离谱操作，导致图像合成质量下降。 5. SD3 Medium的人体绘制问题可能与Stability公司过滤训练数据中成人内容有关，导致模型无法准确生成人体解剖结构。 6. 模型预训练期间可能存在NSFW过滤器过于挑剔，排除了一些并不存在冒犯性的内容，导致模型无法准确描绘人体。 7. 研究人员指出，SD3 Medium的工作在不涉及人物的图片上表现正常，推测是过滤训练数据的NSFW过滤器敏感度过高，将所有人类图像都划入了NSFW范畴。 8. Stability公司强调安全、负责任的AI实践原则，并采取合理措施以防范恶意行为者对SD3 Medium的滥用行为。 9. Stability与英伟达和AMD开展合作，利用英伟达RTX GPU以及TensorRT增强全体Stable Diffusion模型的性能，AMD也优化了SD3 Medium的推理性能.

该试读文章来自《AI 前线》，如需阅读全部文章，
请先领取课程

免费领取

登录后留言

精选留言

由作者筛选后的优质留言将会公开显示，欢迎踊跃留言。

收起评论