Distinctive Image Features from Scale-Invariant Keypoints 논문 리뷰

Nolja놀자 2023. 2. 19. 18:09

2023. 2. 19. 18:09

SIFT(Scale Invariant Feature Transform)

이미지 데이터를 스케일에 불변하고 로컬 feature에 상대적인 좌표계 Feature로 변환시키는 알고리즘이다.

SIFT는 각각의 픽셀의 그래디언트 벡터를 계산한다.

그리고 그래디언트 방향의 정규화된 히스토그램을 그린다.

SIFT의 4단계

1. Scale-space extrema detection

: diffence-of-gaussian function을 이용하여 크기와 방향에 불변하는 잠재적인 포인트를 정한다.

2. Keypoint localization

: model이 location과 scale을 결정한다. 키포인트는 stability로 결정된다.

3. Orientation assignment

: 각각의 키포인트에 로컬 이미지 그래디언트값에 따라 방향이 할당된다.

4. Keypoint descriptor

: 모든 키포인트 주변에서 로컬 이미지 그래디언트값이 계산된다.

SIFT descriptor는 16x16의 이웃을 생성한다.

이는 각각 4x4의 subregions로 나누어져있다.

각각의 픽셀에서(subregion과 함께)

각각의 방향을 8가지 방향 중 하나로 양자화하고, magnitude에 의한 각각의 벡터의 기여도의 가중치를 구함으로써

SIFT는 픽셀의 그래디언트 벡터를 히스토그램에 추가한다.

각각의 그래디언트 방향은 가우시안 스케일 n/2로 가중치를 가진다. (n = 이웃의 크기)

그래디언트 방향 값은 이웃 빈들에게로 분산되며, 이때 trilinear interpolation을 사용한다. (경계 효과를 줄이기 위해)

Optical Flow란? (0)	2023.02.19
Bag of Visual word 알고리즘이란? (0)	2023.02.19
VINS-MONO: A Robust and Versatile MonocularVisual-Inertial State Estimator review (0)	2023.02.13
Bundle Adjustment — A Modern Synthesis 논문 리뷰[2000] (0)	2023.01.25
ORB-SLAM: a Versatile and Accurate Monocular SLAM System 논문 리뷰[2015-02] (0)	2023.01.24

가전제품 이것저것 이야기