부트캠프/컴퓨터 비전

YOLO

례지 2022. 12. 19. 11:44
728x90
YOLO
  • multi object detection에 최적화된 툴

169 X 5개 만큼의 객체를 탐지할 수 있다.

  • tx, ty: 좌표값
  • th, tw: 가로,세로 값
  • c1: 객체 개수
  • p1_1 ~ p1_20: 클래스
Box post processing

  • class_label은 airplane
YOLO 추론 요약

시맨틱 분할
  • 시맨틱 분할에서 각 픽셀은 픽셀이 속한 객체의 클래스로 분류됨
    • 예) 도로, 자동차, 보행자, 건물 등, 또한 클래스가 같은 물체는 구별되지 않음
    • 이 작업에서 가장 어려운 점은 이미지가 일반적인 CNN을 통과할 때 점진적으로 위치 정보를 잃는 것 (1 이상의 스트라이드를 사용하는 층 때문)

전치 합성곱 층을 사용한 업샘플링
아래쪽 층에서 공간 정보를 복원하는 스킵 연결 층

 

728x90