论文浅尝 - CIKM2020 | Relation Reflection Entity Alignment-白红宇

论文浅尝 - CIKM2020 | Relation Reflection Entity Alignment

阅读量：4203 次

发布时间：2019-05-26

本文共 2915 字，大约阅读时间需要 9 分钟。

论文笔记整理：谭亦鸣，东南大学博士生。

来源：CIKM 2020

链接：https://arxiv.org/pdf/2008.07962.pdf

研究背景与任务描述:

实体对齐旨在基于已有对齐实体标注的情况下，确定不同KG中未知的对等实体，其本质是multi-source KGs的一体化.

随着GNN在对齐工作的引入，现有模型的方法愈加复杂。作者在相关的研究中发现了两个不寻常的情况：Q1. GNN中的标准线性转换效果并不好；Q2. 许多面向预测任务的新KG embedding方法在对齐任务上的效果较差。本文将现有的实体对齐方法抽象为统一的框架：Shape-Builder & Alignment，该框架不仅解释了上述情况的原因，并且给出了对于理想转换操作的两个关键标准。作者基于此构建了一个新的GNN-based method “Relation Reflection Entity Alignment, RREA”，该方法的主要思路是利用relation reflection transformation更有效率的获取到每个实体的relation specific embedding。真实数据上的实验表明该方法是SOAT

目前的Entity Alignment方法主要分为两类：

基于翻译（Translation-based）受跨语言word embedding任务的启发，这类方法假定不同的KG的embedding空间包含相似的分布，因此KGs之间的对齐实体在各自的向量空间中具有相似的位置特性。这类方法首先使用Trans-based KG embedding方法对各KG做单独的表示学习，得到各自的entity和relation向量表示，而后使用已知的（标注的）实体对齐将其投影到统一的向量空间中。

基于GNN（GNNs-based）不同于上述方法（relation作为实体之间的转换），GNNs通过邻居节点的集合（聚集）信息，生成节点级别的embedding。

对于上述两个问题的分析和猜想：

Q1. GNN最初是使用标准线性变换矩阵设计的，但是许多GNN-based将其约束为单位或者对角线。过去的方法都将其视为参数规约，但是并未就此做出解释和讨论。作者尝试在GCN-Align中删去这个设置时，模型性能在Hits@1上下降了10%，因此认为其中存在某些更加本质的问题；

Q2.许多任务中（比如链接预测）都需要KG模型，许多新的KG embeddings方法被提出并在这些任务上取得了不错的效果。但是在链接预测之类任务上效果出众的模型却没有在对齐任务上展现出显著的优势，过去的工作中仅给出了“并不是所有对于链接预测有效的模型都适用于实体对齐”，但并未给出进一步的分析。

为了进一步分析两者的原因，作者提出了一个抽象实体对齐框架，名为“Shape-Builder & Alignment”。在这个框架中，Trans-based与GNN-based方法均被视为各自设置下的特例。通过这个框架，作者成功找到了上述问题的答案：

A1. 实体对齐假定了两个（KG）分布具有相似性，所以为了避免结构性的破坏，在转换之后，实体的norms以及相对距离等信息应该保持不变，因此转换矩阵被强制为正交矩阵。

A2. 许多新的KG embedding方法都遵循了一个关键的idea-“将实体的embeddings转换为relation specific的版本”。然而他们的转换矩阵并不能服从正交属性，这就是实体对齐中这些方法效果不佳的原因。

因此作者提出两个实体对齐上理想转换操作的标准：1. Relation Differentiation；2. Dimensional Isometry；基于这两个标准，作者提出一种新的转换操作 “Relation Reflection Transformation”：该操作能够沿不同关系的超平面反映entity embeddings，从而用于构建relation specific entity embeddings. 这种反映矩阵（reflection matrix）是正交的，因此能够保证转换过程中的实体及其相对距离的不变性。（作者将该转换添加到GNN模型中，得到新的实体对齐方法RREA，relation reflection entity alignment）

Shape-Builder & Alignment

下图是作者提出的统一对齐框架的过程示意图：