OMNIPARSER은 텍스트 탐지, 핵심 정보 추출, 테이블 인식 등 다양한 비주얼 텍스트 파싱 작업을 단일 모델로 통합적으로 수행할 수 있다.
문서 이미지 이해를 위해 기존 문서 이해 모델과 대규모 언어 모델을 결합한 LayoutLLM 모델을 제안한다. 이를 통해 다양한 문서 분석 작업을 단일 모델로 유연하게 수행할 수 있다.