반응형

 

논문 링크입니다.

https://arxiv.org/pdf/1502.00956v2.pdf

2015년 2월 발행

 

0. Title

ORB-SLAM: a Versatile and Accurate Monocular SLAM System 

=> ORB SLAM에 대한 논문인 것 같다..

다용도의(혹은 변하기 쉬운) 정확한 단안 SLAM 시스템

 

1. Abstract

이 논문은 ORB-SLAM에 대해 소개하고 있다.

ORB-SLAM은 피쳐 베이스의 단안 SLAM 시스템이다.

ORB-SLAM은 실시간에서도, 좁거나 넓은 환경에서도, 실내나 실외 환경에서도 작동한다.

 

이 시스템은 심각한 motion clutter(움직임이 정돈되지 않고 어지러운 현상?)에 강하고

다양한 loop closing과 relocalization 베이스라인을 허용하고

완전 자동 초기화를 포함한다.  

 

우리는 모든 SLAM 과정(tracking, mapping, relocalization, and loop closing)에서 동일한 피쳐를 사용하는 새로운 시스템을 만들었다.

reconstruction의 포인트와 키프레임을 선택하는 전략으로 인해

어려운 상황에서도 잘 동작하며(robustness), 간결하고 추적 가능한 map을 생성할 수 있었다.

 

 

2. Conclusion and Decision

- 1) Conclusions

현재까지는 실시간 단안 SLAM 기법 중에 PTAM 이 가장 정확하다고 여겨진다. (https://www.robots.ox.ac.uk/~gk/publications/KleinMurray2007ISMAR.pdf)

PTAM의 백엔드가 bundle adjustment(ba)인 것은 우연이 아니다.

BA는 오프라인 Structure from Motion(SFM) 문제에서 표준으로 잘 알려져 있다.

 

PTAM의 가장 큰 성공 요인 중 하나는,

BA를 SLAM에 가져오고 실시간 환경에서 적용했다는 것이다.

 

우리 연구의 주요한 기여는 PTAM의 versatility를 확장시킴으로써 

다루기 힘든 환경에서 사용할 수 있게 만든 것이다. 

이를 위해, 아래의 요소들을 제외한 알고리즘을 바닥부터 설계하였다.

- Loop Detection (http://doriangalvez.com/papers/GalvezTRO12.pdf)

- Loop Closure procedure (http://www.roboticsproceedings.org/rss06/p10.pdf)  and Covisibility Graph (https://www.doc.ic.ac.uk/~ajd/Publications/strasdat_etal_iccv2011.pdf)

- the Optimization framework g2o (https://mengwenhe-cmu.github.io/Reading-Reports/Research/Localization/Graph_Optimization/g2o_A_General_Framework_for_Graph_Optimization/paper.pdf)

- ORB features (http://www.gwylab.com/download/ORB_2012.pdf)

 

 

우리는 spawn과 cull keyframes으로 매 프레임마다 키프레임을 생성할 수 있도록 하였다.

이것은 불필요하다면 결과적으로 제거되도록 설계되어 있다.

이렇게 유동적으로 map을 다룰 수 있는 기능

공회전이나 빠른 움직임과 같은 조건이 좋지 않은 상황에 매우 유리하다.

왜냐하면 동일한 곳에서 반복적으로 운영했을 때,

장면이 바뀔 때에만 map이 확장하기 때문이다.

 

 

- 2) Sparse/Feature-based vs. Dense/Direct Methods

최근의 실시간 단안 SLAM 알고리즘(DTAM, LSD-SLAM)들은 

환경의 dense나 semi-dense reconstruction를 수행할 수 있다.

동시에 카메라는 이미지 픽셀 intensity에 따라 직접적으로 최적화되며 localize 된다.

이러한 direct method는 피쳐 추출을 필요로 하지 않고, 이는 대응되는 결과물을 반영하지 못한다.

이들은 블러 되고, low-texture나 아스팔트처럼  high-frequency 환경에서 잘 작동한다.

 

하지만, direct method는 고유의 한계가 있다.

첫째, direct method는 표면 반사율 모델을 가정하여 실제 장면에서 그 결과물을 스스로 추출한다고 여긴다.

 이러한 광도계의 일관성은 매칭들의 베이스라인을 제한한다.

일반적으로 피쳐들이 허용하는 것보다 베이스라인이 좁다.

이것은 넓은 베이스라인을 요구하는 reconstruction 정확도에 큰 영향을 끼친다.

둘째, direct method는 일반적으로 컴퓨팅 비용을 많이 요구한다.

일례로 DTAM에서는 map의 크기가 점진적으로 증가한다.

 

반대로, feature-based method는 넓은 베이스라인을 허용하고, 

BA가 모든 센서 측정치를 사용하면서 카메라 포즈와 포인트를 공동으로 최적화시킨다.

(또한, sparse 한 map을 통해 메모리 효율성이 높아질 것으로 예상된다.) 

 

 

 

 

3. Introduction

- Bundle Adjustment

BA는 카메라 localization의 정확한 예측을 할 뿐만 아니라, sparse한 기하학적 reconstruction이 가능한 것으로 알려져 있다.

하지만 오랜 시간동안, 이 접근법은 Visual SLAM과 같은 실시간 동작에는 적합하지 않다고 여겨졌다.

Visual SLAM은 환경을 reconstruction하는 동시에 카메라 궤적을 추정해야하기 때문이었다.

하지만 최근에 더 정확한 결과를 위해서 다음과 같은 환경에서 BA의 적용이 불가피해졌다.

: 선택된 프레임들 중에 포인트를 대응시키는 것

: 키프레임의 개수가 늘어남에 따라 선택적으로 선별하여 불필요한 프레임을 줄여야 함

: 키프레임과 포인트들의 강력한 네트워크 설정 

: 키프레임 포즈와 포인트 위치의 non-linear한 초기의 추정

: 실시간에서 빠른 global optimization을 할 수 있는 능력

 

 

 

 

 

 

 

반응형

+ Recent posts