我校计算机学院(软件学院)苏向东、高光来教授课题组论文被世界尖端会议ACL2024选用
ACL(Annual Meeting of the Association for Computational Linguistics)是AI范畴自然语言处理(Natural Language Processing,NLP)方向最威望的世界会议之一,是CCF A类会议。本次被ACL2024选用的论文榜首作者李江为高光来教授组辅导的博士研讨生,该论文初次聚集于多范畴的常识图谱补全问题。该研讨工作得到了国家自然科学基金项目以及自治区要点研制和效果转化方案项目的经费支撑,蒙古文智能信息处理技能国家当地联合工程研讨中心为该项研讨供给了软硬件支撑。
常识图嵌入经过将实体和联系表明为低维度向量,在链接猜测使命中得到了广泛使用。在实践使用中,常识图往往包括了多个范畴,这对常识图的表明提出了较大应战。但是,现有的KGE办法很少对多域常识图中的嵌入散布进行清晰的域约束,这会导致不同域的嵌入堆叠,以此来降低了链接猜测的功能。
为了应对这一应战,文章提出了“双阿基米德螺旋常识图嵌入”(DuASE),这是一种专为多范畴常识图规划的低维度嵌入模型。DuASE的动机来源于课题组的一个发现:联系类型可拿来区别不相同的范畴的实体。在常识图谱的语境中,“域”一词用于描绘图谱所包括或代表的特定主题范畴或常识类别,指的是包含在图谱中的实体、概念和联系的规模,不同域之间的差异大多数表现在实体类型和联系类型上。因为大多数常识图谱中没供给实体类型信息,课题组主要是依托联系类型来完成域常识的区别,并避免嵌入堆叠问题。
详细而言,DuASE在同一个阿基米德螺旋上对具有相同联系的实体进行编码,有用区别不相同的范畴的实体。为避免跨域嵌入的堆叠,DuASE进一步使用正则化函数保证同一三元组内的头实体和尾实体沿各自的域空间螺旋。因而,在对多域常识图进行建模时,DuASE可以更精确地捕捉域信息和实体间的依靠联系,然后优化常识图的嵌入表明。此外文章还构建了多域数据集n-MDKG,并在n-MDKG和其他三个基准数据集上验证了DuASE的有用性。