当前位置：首页 > 人工智能 > 正文

AI图像编辑技术DragGAN开源用户可以在生成图像之后再进行重新编辑

2023-06-28 15:22:59　来源：IT之家　

　　近日来自马克斯・普朗克计算机科学研究所、MIT CSAIL 和谷歌的研究者们研究了一种控制 GAN 的新方法 DragGAN，只要点击拖拽，用户就可以“改变汽车的尺寸或者将人物的笑容变成皱眉”。目前该项目已经在 GitHub 中开源，有兴趣的小伙伴们可以前往了解。

　　视频源 DragDAN，微博视频转录由科普君 XueShu

　　DragGAN 是一个直观的图像编辑工具，用户只需要控制图像中的像素点和方向，就可以快速调整照片主体的位置、姿态、表情、大小和角度等。这种工具的潜力主要表现在，从文本生成图像的人工智能并不总是能输出你想要的结果，所以用户可以在生成图像之后再进行重新编辑，而不必重新生成一个新的图像。

　　图源 DragGAN

　　图源 DragGAN

　　研究论文中展示了一些演示案例，包括增加山峰的高度，改变模特的姿势和衣服的长度和形状，张开或闭合狮子的嘴巴，以及将一个人的表情从平淡变成微笑。

　　研究人员表示，他们的方法在基于 GAN 的操作中优于 SOTA，并为图像编辑开辟了新方向。在接下来的几个月里，他们希望将基于点的编辑扩展到 3D 生成模型。

　　虽然公布了源代码，但源代码有严格的限制：

　　本作品及其任何衍生作品只能用于或打算用于非商业用途。尽管有上述规定，英伟达公司及其附属机构可以在商业上使用该作品和任何衍生作品。在此，"非商业" 是指仅用于研究或评估目的。

免责声明： 激光网遵守行业规则，本站所转载的稿件都标注作者和来源。激光网原创文章，请转载时务必注明文章作者和来源“激光网”，不尊重本站原创的行为将受到激光网的追责，转载稿件或作者投稿可能会经编辑修改或者补充，如有异议可投诉至：Email：133 467 34 45@qq.com

榜单