人工智能第二讲知识图谱的表示

桂花香博客 2024-03-22 1 0

一、什么是知识表示

传统人工智能领域有一个研究方向——知识工程与专家系统，其基本思想是建立一个系统，从专家大脑获取知识，再通过一个推理引擎，为非专家用户提供服务。

符号表示：传统AI领域知识的表示方法以符号表示为主，以计算机符号来表示人脑中的知识逻辑。其缺点是不易于刻画隐式的知识，同时推理过于依赖知识描述的精确性，比如一个字符串表示稍有错误就无法完成推理。

向量表示：而现在，随着深度学习和表示学习的兴起，用参数化向量来表示实体以及实体之间的关系，并利用神经网络来实现更加鲁棒的推理，优点是易于捕获隐式的知识。另一个优点是将推理过程转化为向量、矩阵或者张量之间的计算，摆脱了传统基于符号搜索的推理方式。缺点是丢失了符号表示的可解释性。

二、AI历史发展长河中的知识表示方法

三、知识图谱的符号表示方法

三种最常用的符号表示方法：属性图、RDF图、OW本体语言

1、属性图

2、RDF

RDF是国际万维网联盟W3C推动的面向Web的语义数据标准，

代表 Resource Description Framework (资源描述框架），实质是数据交换标准规范，而非存储模型

基本组成单元是三元组SPO，多个三元组头尾相互连接就形成了PDF图

本质上RDF图是有向标记图

RDF还提供了基本的构件，用于定义类、属性等

但RDF加上RDFS的表达能力非常有限，在实际应用刻画复杂概念时就需要用到OWL等本体表达语言。

3、OWL

本体是一个哲学概念，本体论是对存在、变化和物质的基本范畴和其相互关系的研究

在AI领域中，本体是对智能体可以正式存在的概念和关系的描述，类似于程序的正式规范

本体最常用的逻辑表达语言即逻辑描述

OWL可以看作是RDF的扩展其在RDF的基础上增加了更多的语义表达构件，例如通过多个类组合定义更为复杂的类

OWL同时是一个语言家族，其有许多不同表达构件的组合，不同的组合对于不同的推理计算复杂度，以及适应的表达场景

4、小结

四、知识图谱的向量表示方法

为知识图谱中每一个实体和关系创建向量表示，利用向量、矩阵来实现高效运算

1、词向量表示

两种词向量的表示方法：

第一种One-hot Encoding，每个词向量都相当于词典大小，在所对应处为“1”，其余地方为“0”

第二种Bag-of-words，给点一个文档，利用文档出现的所有词的个数来组成文档的向量表示

2、词的语义由什么来决定——分布式语义

词的语义由它被使用的上下文确定——即分布式语义

3、Word Embedding/词嵌入

统计词在大量语料中的上下文规律，通过词的上下文计算词的分布式向量表示，做到词的每一个维度都有数值表示，称为低纬稠密的向量表示，也称为词的嵌入表示

4、词嵌入＞知识图谱嵌入

利用三元组结构来学习知识图谱中实体和关系的表示，如TransE模型

5、TransE模型

给定一个三元组，其中 h代表 subject (主语)，r 代表 predicate (谓词)，t 代表 object (宾语) ，如果三元组代表的事实是客观存在的，那么hrt的向量表示应满足加法规律，即 풉 + 풓 = t, 如Rome + is-capital-of = Italy。

对于每一个三元组，定义一个评分函数 f ，然后对所有的三元组计算损失函数 L

优化目标是真实存在的三元组得分尽可能高，假设的三元组得分尽可能少

6、如何评估实体和关系的向量表示的好坏

最简单的办法是给的三元组中的两个，计算未知的，看预测的结构是否准确

7、小结

五、总结

夸智网

人工智能第二讲知识图谱的表示

自然语言处理人工智能知识图谱嵌入表示为何能有效支持对未知三元组的链接预测任务？

人工智能自然语言处理知识图谱顶会论文(IJCAI-2022) TEMP：多跳推理的类型感知嵌入

发表评论取消回复

夸智网

人工智能 第二讲 知识图谱的表示

自然语言处理 人工智能 知识图谱嵌入表示为何能有效支持对未知三元组的链接预测任务？

人工智能 自然语言处理 知识图谱顶会论文(IJCAI-2022) TEMP：多跳推理的类型感知嵌入

相关文章

发表评论取消回复

人工智能第二讲知识图谱的表示

自然语言处理人工智能知识图谱嵌入表示为何能有效支持对未知三元组的链接预测任务？

人工智能自然语言处理知识图谱顶会论文(IJCAI-2022) TEMP：多跳推理的类型感知嵌入