Overview of this survey

Overview of this survey

2.1 Problem Formulation and Taxonomy

VOS

<aside> πŸ’‘ 일반적으둜 λ™μ˜μƒ νŽΈμ§‘μ˜ 개체 제거, μ½˜ν…μΈ  기반 λΉ„λ””μ˜€ μ½”λ”© 및 화상 회의의 가상 λ°°κ²½ 생성과 같은 일뢀 λΉ„λ””μ˜€ 뢄석 및 νŽΈμ§‘ κ΄€λ ¨ μ• ν”Œλ¦¬μΌ€μ΄μ…˜ μ‹œλ‚˜λ¦¬μ˜€μ— μ‚¬μš©λ©λ‹ˆλ‹€. λΆ„ν• λœ 객체의 μ •ν™•ν•œ 의미둠적 λ²”μ£Όμ—λŠ” 관심이 μ—†μŠ΅λ‹ˆλ‹€.

</aside>

VOSλŠ” μž₯면에 더 λ§Žμ€ 관심을 기울일 수 μžˆμŠ΅λ‹ˆλ‹€. 인간이 λ§Œλ“  미디어에 λ‚˜νƒ€λ‚˜λŠ”, μ’…μ’… 큰 카메라 μ›€μ§μž„, λ³€ν˜• 및 λͺ¨μ–‘ λ³€ν™”κ°€ μžˆμŠ΅λ‹ˆλ‹€.

VSS

<aside> πŸ’‘ 이미지 μ‹œλ§¨ν‹± 뢄할을 μ‹œκ³΅κ°„ μ˜μ—­μœΌλ‘œ 직접 ν™•μž₯ν•œ VSSλŠ” λΉ„λ””μ˜€μ—μ„œ 미리 μ •μ˜λœ 의미 λ²”μ£Ό(예: μžλ™μ°¨, 건물, λ³΄ν–‰μž, λ„λ‘œ) λ‚΄μ˜ 개체λ₯Ό μΆ”μΆœν•˜λŠ” 것을 λͺ©ν‘œλ‘œ ν•©λ‹ˆλ‹€. λ”°λΌμ„œ Y λŠ” 닀쀑 클래슀 의미 뢄석 곡간에 ν•΄λ‹Ήν•©λ‹ˆλ‹€. VSSλŠ” 물리적 ν™˜κ²½μ— λŒ€ν•œ 높은 μˆ˜μ€€μ˜ 이해가 ν•„μš”ν•œ λ‘œλ΄‡ 감지, 인간‑기계 μƒν˜Έ μž‘μš© 및 자율 μ£Όν–‰κ³Ό 같은 λ§Žμ€ μ‘μš© λΆ„μ•Όμ—μ„œ 인식 기반 역할을 ν•©λ‹ˆλ‹€.

</aside>

VSSλŠ” μ’…μ’… 정확도와 λŒ€κΈ° μ‹œκ°„, μž‘μ€ 물체의 μ •ν™•ν•œ 감지, λͺ¨λΈ 병렬화 및 도메인 κ°„ μΌλ°˜ν™” κΈ°λŠ₯ μ‚¬μ΄μ˜ κ· ν˜•μ„ ν•„μš”λ‘œ ν•˜λŠ” 자율 μ£Όν–‰κ³Ό 같은 μ• ν”Œλ¦¬μΌ€μ΄μ…˜μ— 쀑점을 λ‘‘λ‹ˆλ‹€


VOS와 VSSλŠ” λΉ λ₯Έ λ™μž‘ 및 개체 폐색과 같은 λͺ‡ κ°€μ§€ 일반적인 문제λ₯Ό 곡유

Inference Modes for VOS Methods

Automatic VOS (AVOS), (unsupervised video segmentation or zero-shot video segmen-tation)

Untitled

μž…λ ₯ 곡간 X λŠ” λΉ„λ””μ˜€ 도메인 V λ§Œμ„ λ‚˜νƒ€λƒ…λ‹ˆλ‹€. AVOSλŠ” λΉ„λ””μ˜€ 뢄석에 μ ν•©ν•˜μ§€λ§Œ μž„μ˜μ˜ 개체 λ˜λŠ” ν•΄λ‹Ή 뢀뢄을 μœ μ—°ν•˜κ²Œ λΆ„ν• ν•΄μ•Ό ν•˜λŠ” λΉ„λ””μ˜€ νŽΈμ§‘μ—λŠ” μ ν•©ν•˜μ§€ μ•ŠμŠ΅λ‹ˆλ‹€. 일반적인 μ‘μš© ν”„λ‘œκ·Έλž¨μ€ 화상 회의의 가상 λ°°κ²½ μƒμ„±μž…λ‹ˆλ‹€.


Semi-automatic VOS (SVOS), (semi-supervised video segmentation or one-shot video segmentation)

Untitled