AI 前线
InfoQ
AI 前线团队
5249 人已学习
免费领取
课程目录
已更新 75 讲/共 1000 讲
AI 前线
15
15
1.0x
00:00/00:00
登录|注册

喜发新模型,却被众嘲是破产“前兆”!Stability AI “最强”模型人形绘制太“阴间”,网友:因为研发太讲武德

整理  |  华卫、核子可乐
6 月 12 日,Stability AI  推出了  Stable Diffusion 3 Medium,这家英国初创公司称其为“迄今为止最先进的文本到图像开放模型”。至关重要的是,该模型可以在消费级 PC、笔记本电脑等个人消费系统以及企业级 GPU 上运行时生成这些图像。
要体验 SD3 Medium,可使用 Stability Platform(https://platform.stability.ai/)上的 API,注册 Stable Assistant(https://stability.ai/stable-assistant)以获取三天免费试用,也可通过 Discord 体验 Stable Artisan(https://stability.ai/stable-artisan)。
据介绍,SD3 Medium  由  20  亿个参数组成,无需复杂的工作流程即可获得逼真的结果。  模型的大小也是 SD3 Medium  的核心亮点,该模型比许多  Stable Diffusion 3  模型都要小,后者的参数范围在  8  亿到  80  亿之间。
Stability  公司表示,其构建  SD3 Medium  来理解涉及空间关系、构图元素、动作和风格的复杂提示,它还能克服手部和面部常见的伪影和瑕疵。但意外的是, SD3 Medium  一经发布,却因手脚等人体部位的“奇怪”绘制引发了“群嘲”。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

1. Stability AI推出了Stable Diffusion 3 Medium,这是一款文本到图像开放模型,具有20亿个参数,可以在个人消费系统和企业级GPU上运行。 2. SD3 Medium的突破性特点包括出色的整体质量与照片级真实感、提示词理解、排版功能、资源高效和微调。 3. SD3 Medium在人体绘制方面引发了用户的嘲笑,因为其生成的人体图像在结构上表现出诡异扭曲的视觉效果。 4. 用户在Reddit上指出SD3 Medium在渲染人物,特别是在手、脚等肢体方面的离谱操作,导致图像合成质量下降。 5. SD3 Medium的人体绘制问题可能与Stability公司过滤训练数据中成人内容有关,导致模型无法准确生成人体解剖结构。 6. 模型预训练期间可能存在NSFW过滤器过于挑剔,排除了一些并不存在冒犯性的内容,导致模型无法准确描绘人体。 7. 研究人员指出,SD3 Medium的工作在不涉及人物的图片上表现正常,推测是过滤训练数据的NSFW过滤器敏感度过高,将所有人类图像都划入了NSFW范畴。 8. Stability公司强调安全、负责任的AI实践原则,并采取合理措施以防范恶意行为者对SD3 Medium的滥用行为。 9. Stability与英伟达和AMD开展合作,利用英伟达RTX GPU以及TensorRT增强全体Stable Diffusion模型的性能,AMD也优化了SD3 Medium的推理性能.

该试读文章来自《AI 前线》,如需阅读全部文章,
请先领取课程
免费领取
登录 后留言

精选留言

由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论
显示
设置
留言
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部