이 논문은 멜-로포머라는 새로운 딥 뉴럴 네트워크 모델을 소개한다. 멜-로포머는 두 가지 핵심 설계를 특징으로 한다:
멜-로포머는 두 가지 핵심 MIR 작업에 적용된다:
이 두 작업은 최적화 목표가 다르지만, 멜-로포머는 우수한 성능을 보여준다. 보컬 분리 모델을 사전 학습 모델로 활용하여 보컬 멜로디 전사 모델을 미세 조정하는 접근법을 제안한다.
실험 결과, 멜-로포머는 벤치마크 데이터셋에서 보컬 분리와 멜로디 전사 작업 모두에서 최신 성능을 달성했다. 이는 멜-로포머의 효과성과 다양성을 입증한다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Ju-Chiang Wa... a las arxiv.org 09-10-2024
https://arxiv.org/pdf/2409.04702.pdfConsultas más profundas