一、什么是知识表示

传统人工智能领域有一个研究方向——知识工程与专家系统,其基本思想是建立一个系统,从专家大脑获取知识,再通过一个推理引擎,为非专家用户提供服务。

        符号表示:传统AI领域知识的表示方法以符号表示为主,以计算机符号来表示人脑中的知识逻辑。其缺点是不易于刻画隐式的知识,同时推理过于依赖知识描述的精确性,比如一个字符串表示稍有错误就无法完成推理。

        向量表示:而现在,随着深度学习和表示学习的兴起,用参数化向量来表示实体以及实体之间的关系,并利用神经网络来实现更加鲁棒的推理,优点是易于捕获隐式的知识。另一个优点是将推理过程转化为向量、矩阵或者张量之间的计算,摆脱了传统基于符号搜索的推理方式。缺点是丢失了符号表示的可解释性。

二、AI历史发展长河中的知识表示方法

三、知识图谱的符号表示方法 

三种最常用的符号表示方法:属性图、RDF图、OW本体语言

1、属性图

2、RDF

RDF是国际万维网联盟W3C推动的面向Web的语义数据标准,

代表 Resource Description Framework (资源描述框架),实质是数据交换标准规范,而非存储模型

基本组成单元是三元组SPO,多个三元组头尾相互连接就形成了PDF图

本质上RDF图是有向标记图

RDF还提供了基本的构件,用于定义类、属性等

但RDF加上RDFS的表达能力非常有限,在实际应用刻画复杂概念时就需要用到OWL等本体表达语言。

3、OWL

本体是一个哲学概念,本体论是对存在、变化和物质的基本范畴和其相互关系的研究

在AI领域中,本体是对智能体可以正式存在的概念和关系的描述,类似于程序的正式规范

本体最常用的逻辑表达语言即逻辑描述

OWL可以看作是RDF的扩展 其在RDF的基础上增加了更多的语义表达构件,例如通过多个类组合定义更为复杂的类 

OWL同时是一个语言家族,其有许多不同表达构件的组合,不同的组合对于不同的推理计算复杂度,以及适应的表达场景

4、小结

四、知识图谱的向量表示方法

为知识图谱中每一个实体和关系创建向量表示,利用向量、矩阵来实现高效运算

1、词向量表示

两种词向量的表示方法:

第一种One-hot Encoding,每个词向量都相当于词典大小,在所对应处为“1”,其余地方为“0”

第二种Bag-of-words,给点一个文档,利用文档出现的所有词的个数来组成文档的向量表示

2、词的语义由什么来决定——分布式语义

词的语义由它被使用的上下文确定——即分布式语义

3、Word Embedding/词嵌入

        统计词在大量语料中的上下文规律,通过词的上下文计算词的分布式向量表示,做到词的每一个维度都有数值表示,称为低纬稠密的向量表示,也称为词的嵌入表示

4、词嵌入>知识图谱嵌入

利用三元组结构来学习知识图谱中实体和关系的表示,如TransE模型

5、TransE模型

        给定一个三元组,其中 h代表 subject (主语),r 代表  predicate (谓词),t 代表  object (宾语) ,如果三元组代表的事实是客观存在的,那么hrt的向量表示应满足加法规律,即 풉 + 풓 = t, 如Rome + is-capital-of = Italy。

对于每一个三元组,定义一个评分函数 f ,然后对所有的三元组计算损失函数 L

优化目标是真实存在的三元组得分尽可能高,假设的三元组得分尽可能少

6、如何评估实体和关系的向量表示的好坏

最简单的办法是给的三元组中的两个,计算未知的,看预测的结构是否准确

7、小结

五、总结

推荐阅读

评论可见,请评论后查看内容,谢谢!!!评论后请刷新页面。