-
컴공생의 공부 일기
-
공부보단 일기에 가까운 것 같은
-
블로그
👅 트랜스포머 멀티 모달 러닝 서베이 [Multimodal Learning With Transformers: A Survey] 논문 리딩 (2)
😛4. APPLICATION SCENARIOS - 😛7. CONCLUSION👅 논문 읽기집중력 소멸👅 논문 정리하기 😛4. APPLICATION SCENARIOS 1️⃣ 멀티모달 사전학습용 Transformers (4.1) ➡️ 대규모 멀티모달 데이터셋으로 미리 학습된 모델→ 다양한 다운스트림 작업에 전이학습, zero-shot 가능 (1) 과제 비특화 (4.1.1) 이미지-텍스트, 비디오-텍스트, 음성-텍스트 등 일반적 멀티모달 조합대표 모델: VisualBERT, ViLBERT, LXMERT, UNITER, VideoBERT, CLIPpretext task: MLM, ITM, masked image region prediction 등특징: 정렬된 데이터에 의존 → 대규모 데이터 필요, ..
2025. 5. 4.