<
Photo-Realistic Single image Super-Resolution Using Generative Adversarial Network
>
上一篇

Jekyll 다시 시작
下一篇

(진행중)Progressive Growing of GANs for Improved Quality Stability and Variation

Abstract

깊고 빠른 컨볼루션 뉴럴넷을 이용하여 싱글이미지의 super-resolution의 정확도와 속도가 발전했음에도 불구하고 하나의 큰문제는여전히 남아있다 : 큰 배수의 고해상도작업에서 어떻게 좋은 디테일을 복구할것인가? 최적화 기반의 super-resolution 방법들은 주로 목적함수를 고르는것에 좌우된다. 현재의 작업은 MSRE 를 최소화 하는데 큰 초점을 맞추고 있다. 결과인 추정치들은 높은 PSNR 을 가지고 있으나, 그들은 높은 확률로 더 높은 해상도에서는 사람의 지각적으로 기대할만한 결과를 만드는데는 실패했다 이 논문에서는 SRGAN 이라는 super-resolution 을 위한 GAN 모델을 보여준다. 우리가 아는 바로는 이것은 사진을 리얼하게 4배로 확대할수 있는 최초의 프레임웤이다 이것을 하기위해, 지각적인 손실 함수를 제안한다. adversarial loss과 content loss 로 이루어진. adversarial loss 는 확대된 이미지와 오리지날 이미지를 구분하도록 학습된 판별기를 사용하여 우리의 해결책을 제시한다. 추가로 픽셀공간의 유사도 대신 지각적 유사도에 반응하는 content loss를 사용했다. 우리의 deep residual network 는 공공 이미지의 매우 축소된 이미지에서 사실적인 텍스쳐를 복구 할수 있다. 연장된 MOS 검사는 SRGAN을 사용한 지각적 퀄리티의 매우 중요한 이점을 보여준다. SRGAN 과 MOS 점수는 다른 어떤 최신방법보다 더 실제 이미지에 가깝게 해준다.

1. Introduction

저해상도 이미지로부터 고해상도 이미지를 예측하는 도전적인 작업은 super-resolution 이라 한다. SR 은 CV 연구에서 많은 관심을 받았으며 수 많은 어플을 보유하고 있다.

underdetermined한 SR문제의 나쁜 특성은 특히 높은 배율에서 확연히 나타나는데, 재구성된 SR 이미지에는 텍스쳐의 디테일한부분이 일반적으로 업다.

SR 지도 알고리즘의 최적화 대상은 실제이미지와 생성된 이미지의 MSE 가 흔하다. MSE를 최소화 하는것은 또한 PSNR을 최대화 하는것이기도 한데, SR알고리즘에 평가 및 비교에 사용되는 일반적인 척도이다. 그러나 MSE와 PSNR의 고급 텍스쳐 디테일에서 지각적인 차이를 잡아내는 능력은 매우 제한적이인데 픽셀단위 이미지의 거리를 기반으로 하기 때문이다. 이것은 Figure 2에서 그려진다. 가장높은 PSNR 은 지각적으로 더 좋은 결과를 반영하지는 않는다. 원본과 생성된 그림의 지각적 차이는 Ferwerda 에 의해 정의된 것처럼 사실적이지 않음을 의미한다.

이 연구에서 우리는 SRGAN을 제안하는데 깊은 스킵커넥션을 포함한 ResNet을 사용하고 유일한 최적화 목적인 MSE를 쓰는것과는 다르다. 기존과 다른점은 새로운 지각적 손실인 고차원 피쳐맵 VGG 를 합쳤다. 지각적으로 원본이미지와 구분하기 힘든 것을 보와하는 판별기를 포함한. 샘플 이미지는 Figure 에서 4배 업스케일한것을 보여준다.

2. 기존의 작업들

1.1.1 Image super-resolution

현재 대표적 SR 연구는 Nasrollahi, Moeslund, Yang et el 이 있다. 여기서 우린 1장으로 이미지를 확대하는것(SISR)에 중점을 두었고 여러 이미지로부터 하는 작업은 더이상 논하지 않는다. 예측기반의 방법은 SISR과 붙을 최선의 방법중 하나다.
Linear, bicubic, Lanczos filterring 등의 필터링 방법으로 접근할때는 매우 빠르게 할수는 잇지만 SISR 문제를 매우 단순화시키고 과하게 스무스한 텍스쳐를 결과로 제시하는경우가 자주있다. 외곽선 보호에 특별히 초점을 맞추는방법이 제안되었다.

더 강력한 접근법은 저해상도와 고해상도 이미지의 복잡한 매핑을 구축 하는것에 초점을 두거나 학습데이터에 의존하는 것이다. 많은 방법이

Top
Foot