HyperStyle,用于图像编辑的 StyleGAN 的改编版

一队 特拉维夫大学的研究人员最近推出了 HyperStyle,是的 一个颠倒的版本 机器学习系统 英伟达 StyleGAN2 它已经过重新设计,可在编辑真实世界图像时重新创建缺失的部分。

StyleGAN 的特点是允许合成具有逼真外观的新面孔, 设置年龄、性别、头发长度、微笑特征、鼻子形状、肤色、眼镜和摄影角度等参数。

此外, HyperStyle 可以更改现有参数中的类似参数, 换句话说,它允许您在不修改照片特征并保留原始面部可识别性的情况下创建照片。

HyperStyle 引入了超网络来学习如何优化先前训练的 StyleGAN 生成器相对于给定输入图像的权重。 这样做可以通过类似编码器的推理时间和高可编辑性实现优化级别重建。

例如,当使用 HyperStyle,可以模拟照片中人物年龄的变化,改变发型,添加眼镜,胡须或小胡子,使图片看起来像卡通人物或手绘图片,制作悲伤或快乐的表情。

在这种情况下, 该系统不仅可以训练改变人脸,还可以改变任何物体,对于 例如,编辑汽车图像。

大多数研究反演的作品都在寻找可以更准确地重建给定图像的潜在代码。 最近的一些工作提出了对生成器权重的图像微调,以实现给定目标图像的高质量重建。 借助 HyperStyle,我们旨在通过将这些生成器调整方法适应基于编码器的方法,将它们引入交互式应用程序领域。

我们训练了一个超网络来学习如何相对于所需的目标图像优化生成器权重。 通过学习这种映射,HyperStyle 在每张图像不到 2 秒的时间内有效地预测生成器目标权重,使其适用于广泛的应用程序。

拟议的方法 旨在解决在编辑过程中重建图像缺失部分的问题. 先前提出的技术通过微调成像器以替换目标图像的部分同时重新创建最初丢失的可编辑区域来解决重建和编辑之间的平衡。 这种方法的缺点是需要对每个图像的神经网络进行长期有针对性的训练。

基于 StyleGAN 算法的方法允许使用典型模型, 对常见图像集合进行预训练,以生成原始图像的特征元素,其置信度可与需要对每个图像单独训练模型的算法相媲美。

新方法的优点之一是能够以接近实时的性能修改图像,此外 该模型已准备好根据集合为那些人、汽车和动物准备训练 来自 Flickr-the Faces-HQ(FFHQ,70,000 张高质量的人脸 PNG 图像)、The Stanford Cars(16 张汽车图像)和 AFHQ(动物照片)。

另外, 提供了一组工具来训练您的模型以及适用于它们的典型编码器和生成器的现成训练模型。 例如,有一些生成器可用于创建 Toonify 风格的图像、皮克斯角色、创建草图,甚至像迪斯尼公主一样造型。

最后 对于那些有兴趣了解更多的人 关于这个工具,您可以查看详细信息 在下面的链接中。

值得一提的是,代码是使用 PyTorch 框架用 Python 编写的,并且获得了 MIT 许可。 您可以在以下位置检查代码 以下链接。


发表您的评论

您的电子邮件地址将不会被发表。 必填字段标有 *

*

*

  1. 负责资料:AB Internet Networks 2008 SL
  2. 数据用途:控制垃圾邮件,注释管理。
  3. 合法性:您的同意
  4. 数据通讯:除非有法律义务,否则不会将数据传达给第三方。
  5. 数据存储:Occentus Networks(EU)托管的数据库
  6. 权利:您可以随时限制,恢复和删除您的信息。