MMBench는 비전-언어 모델의 다양한 멀티모달 능력을 체계적으로 평가하기 위해 설계된 벤치마크이다.
MMT-Bench는 전문 지식과 정교한 시각 인식, 위치 파악, 추론 및 계획 능력을 요구하는 방대한 멀티모달 과제를 포함하여, 대규모 비전-언어 모델의 멀티태스크 AGI 능력을 종합적으로 평가하는 벤치마크이다.