MobileCLIPは、高速で効率的な画像-テキストエンコーダを提供し、様々なゼロショットタスクで優れた性能を発揮する。提案手法は、画像キャプショニングモデルと強力なCLIPエンコーダアンサンブルからの知識転移を活用した新しい多様モーダル強化学習アプローチを採用している。