图像修复(Inpainting)技术的前沿模型与数据集资源汇总
2024年11月27日·我爱计算机视觉
Fish AI 速读
原文 3648 字,FishAI速读将为你节省 19 分钟
总结
图像修复技术旨在填补图像缺失区域或去除不需要的部分,使其看起来自然。本文介绍了多个前沿的图像修复开源模型和数据集,例如LaMa、PowerPaint、IOPaint、BrushNet和MAT等,它们分别在处理大尺寸遮挡、多功能图像修补、图像扩展、基于分割掩膜修复和高分辨率图像修复等方面具有优势。此外,文章还提供了CelebA、Places2和NVIDIA Irregular Mask等数据集,为图像修复模型的训练和评估提供了宝贵资源,旨在加速开发人员的研究进程,轻松获取所需工具与数据。
关键要点
🤔LaMa模型:由三星、EPFL、Skotech提出,专注于处理大尺寸遮挡区域的图像修复,采用快速傅里叶卷积和高感受野感知损失等技术,在高分辨率下表现出色。
🎨PowerPaint模型:由清华大学(深圳)和上海人工智能实验室开发,支持插入物体、移除物体、图像扩展等多种功能,通过学习定制的任务提示词来实现不同修复任务。
🧰IOPaint工具:一个免费开源的全自动托管图像修复/扩展工具,集成LaMa和PowerPaint等模型,提供擦除、修复和扩展等功能,并提供macOS和iOS应用程序OptiClean。
🖌️BrushNet模型:腾讯和港中大联合开发的即插即用图像修复方法,采用像素级掩膜图像特征插入架构,在图像质量、掩膜区域保留和文本一致性等方面表现优异,并提供BrushData和BrushBench数据集。
🖼️MAT模型:港中大、Adobe等提出的第一个基于Transformer的高分辨率图像修复系统,通过多头上下文注意力和样式操作模块,在Places和CelebA-HQ等数据集上取得了SOTA效果。