VGG넷은 이전의 논문과 비교했을 때 굉장히 깊은 레이어들을 쌓아 완성한 모델이다.

연구의 핵심은 네트워크의 깊이에 따라 성능이 어떻게 변할까에 대한 내용인데

깊이의 영향만을 사용하고자 3x3conv만을 사용했다. 이 3x3conv의 가능성이 많은 주목을 받았고 후대의 연구에 큰 영향을 받았다고 한다. 

 

 

 

1. achite

vgg net은 총 6가지의 모델이 있는데 가장 우측의 2가지 vgg-16, vgg19를 주로 사용한다고 한다. (성능면에서 )

ILSVRC 2014에 최종 제출할 때는 7개 모듈의 Ensemble한 결과를 제출 했고 최종 성적은 2등이다.

 

 

3. 3x3 conv

 

3x3 conv 두개를 연속적으로 사용하면  5x5를 사용한 경우와 같은 영역을 확인 할 수 있다.

 

5x5 = 25 params 인데 반해

3x3x2 = 18params 로 적은 파라미터 갯수를 가진다.

이렇게 파라미터 갯수가 적어짐에 따라 레이어를 더 깊게 가져갈 수 있었다고한다.

 

 

그렇다고 vggnet 자체의 파라미터의 개수가 적은 것은 아니다 오히려 타 network보다 방대한 양의 파라미터를 가지고 있다 이는 FC층의 영향이다

 

 

추가적으로 3x3conv 사이에 relu 비선형성이 더 추가되기에 더 풍부한 특성을 추출가능하다.

(5x5 Convolution 대신에 3x3 Convolution을 두 번 사용 하는 경우 그 성능이 약 7% 향상 됐다고 한다)

'CV > classification' 카테고리의 다른 글

[CV] ResNet  (0) 2022.05.03
[CV] GoogLeNet  (0) 2022.05.02
[CV] Network in Network 리뷰  (0) 2022.05.02
[CV] ZF Net 리뷰  (0) 2022.05.01
[CV] Alex Net 리뷰  (0) 2022.05.01

+ Recent posts