Abstract


[Problem & Motivation]

일치 기반 방법, 특히 space-time 메모리를 기반으로 하는 방법(STM)은 semi-supervised VOS(Video Object Segmentation)의 다른 방법들보다 훨씬 앞서 있음 하지만, 지속적으로 증가하고 중복되는 템플릿 feature는 비효율적인 추론으로 이어지는 문제를 발생시킴

[Propose]

이를 완화하기 위해 메모리 feature의 중복성을 크게 줄이기 위한 새로운 SWEM(Sequential Weighted Expectation Maximization) 네트워크를 제안한다.

→ 프레임 사이의 feature 중복성만 감지하는 이전 방법과 달리 SWEM은 sequential weighted EM 알고리즘을 활용하여 프레임 내 및 프레임 간 유사한 feature를 모두 병합

→ 또한 프레임 feature에 대한 adaptive weight는 SWEM에 하드 샘플을 표현할 수 있는 유연성을 부여하여 템플릿 식별을 향상

→ 또한 제안된 방법은 메모리에 고정된 수의 템플릿 feature를 유지하므로 VOS 시스템의 안정적인 추론 복잡성을 보장


2. Related Work

Matching-based VOS Methods

Learning Fast and Robust VOS

내용 필요

3. Preliminaries

3.1 Expectation-Maximization Algorithm