IT 기술

CNN, R-CNN, Faster R-CNN의 특징

cheons 2022. 9. 7. 19:36
728x90
반응형

객체 인식 분야에서 CNN은 우수한 추론 성능을 보여주는 알고리즘입니다. CNN의 정의 및 모델링 시 고려해야 할 사항은 이전 포스팅에서 다루었습니다. CNN에 대한 내용이 기억이 잘 나지 않으신 분은 아래 링크 참조 바랍니다

 

Deep Learning CNN 설계방법

객체 인식 분야에서 많이 사용되는 딥러닝 CNN 모델을 설계하는 방법에 대해 알아보겠습니다. CNN 정의 Neural Network는 시각 피질이 이미지를 처리하고 인식하는 원리를 수학적 모델으로 정의한 것

shcheon.tistory.com

이번 포스팅에서는 CNN의 연구동향에 대해 간략히 살펴보겠습니다. CNN은 클라우드 컴퓨팅, 병렬 컴퓨팅 기술과 하드웨어의 성능이 향상되어 최근 주목받게 된 알고리즘입니다. CNN은 추론 성능은 우수하지만, 많은 데이터셋과 계산량이 필요하여, 이를 개선하여 탄생한 알고리즘이 R-CNN입니다. R-CNN의 연구동향은 아래와 같이 정리할 수 있습니다.

이미지 인식을 위한 R-CNN 연구 동향

R-CNN 특징

R-CNN 구조
R-CNN 다단계 학습 파이프라인

Fast R-CNN 특징

  • R-CNN의 학습 단계 단순화 및 계산량을 감소시킨 구조
    • 전체 이미지로부터 1개의 feature map과 Regions을 생성
    • ROI pooling : Regions을 Feature map에서 pooling 하여 bin으로 일정하게 나눔
    • Joint Training framework : CNN, Classifier, regressor 훈련을 하나의 과정으로 통합함
  • 문제점
    • Region Proposals CPU로만 계산 가능
    • 여전히 Region Proposals에서 2초 정도 bottleneck이 발생함

Faster R-CNN 구조
ROI Pooling 과정

Faster R-CNN 특징

  • Fast R-CNN과 RPN을 합친 알고리즘
  • RPN(=Region Proposal Network) : Region proposal을 만들기 위한 network
  • Feature map 정보를 활용해 물체가 존재하는 위치를 출력으로 가지는 네트워크를 학습
  • GPU로 계산 가능한 구조

Faster R-CNN 구조

  •  RPN 계산 구조
    • Anchor box : 다양한 크기와 비율을 reference box를 이용하여 객체를 검출
    • reg : box-regressor, cls : box-classifier

Region Proposal Network 구조

 

728x90
반응형