이 논문은 CXL 메모리 확장기에서 저비용 범용 근접 데이터 처리(NDP) 기술을 제안한다. 제안하는 M2NDP 아키텍처는 두 가지 핵심 구성요소인 M2func과 M2μthr로 구성된다.
M2func은 CXL.mem 프로토콜을 활용하여 호스트와 NDP 컨트롤러 간의 저지연 통신을 제공한다. 이를 통해 기존 CXL.io 기반 오프로딩 방식 대비 최대 3.89배 성능 향상을 달성한다.
M2μthr은 RISC-V 기반의 경량 멀티스레딩을 통해 효율적인 NDP 커널 실행을 지원한다. 이를 통해 GPU 대비 주소 계산 오버헤드를 줄이고 자원 활용도를 높일 수 있다.
M2NDP를 통해 다양한 워크로드(OLAP, KVStore, LLM, DLRM, 그래프 분석 등)에서 최대 128배의 성능 향상과 최대 87.9%의 에너지 절감을 달성할 수 있다.
Іншою мовою
із вихідного контенту
arxiv.org
Ключові висновки, отримані з
by Hyungkyu Ham... о arxiv.org 05-01-2024
https://arxiv.org/pdf/2404.19381.pdfГлибші Запити