本文提出了一个名为MIMEA的多粒度交互框架,用于解决多模态实体对齐任务。MIMEA包含以下四个模块:
多模态知识嵌入模块:使用多个独立编码器提取每个实体的模态特定表示。
概率引导模态融合模块:将结构知识作为核心,采用概率分布机制将单模态信息集成到联合模态表示中,同时考虑单模态表示之间的交互。
最优传输模态对齐模块:引入最优传输机制鼓励单模态和联合模态嵌入之间的交互。
模态自适应对比学习模块:区分每个模态下等价实体和非等价实体的嵌入。
这些模块的集成实现了同模态关系和跨模态交互,确保对齐实体在语义上更加接近。实验结果表明,MIMEA在两个真实数据集上的性能都优于现有最先进方法。
To Another Language
from source content
arxiv.org
Deeper Inquiries