핵심 개념
다중 모달 퓨 샷 클래스 점진적 학습을 위한 간소화된 방식으로 세션별 이미지-텍스트 임베딩의 분리성을 향상시키고 하이퍼볼릭 거리를 활용하여 이미지-텍스트 쌍의 표현을 개선함.
통계
실험 결과는 평균 10% 향상을 보여줌.
학습 가능한 매개변수는 최소 8배 적음.
인용구
"세션별 이미지-텍스트 임베딩의 분리성을 향상시키기 위해 Session-Specific Prompts (SSP)를 도입합니다."
"하이퍼볼릭 거리는 이미지-텍스트 쌍의 표현을 개선하기 위해 사용됩니다."