Last ned Linnk AI
•
Forskningsassistent
>
Logg Inn
innsikt
-
ビデオ処理
ビデオトランスフォーマーの行動理解をVLM補助トレーニングで強化する
ViTsとVLMsの補完的な強みを活用して、ビデオトランスフォーマーの視覚エンコーダーを強化し、優れたパフォーマンスを実現します。
1