1,知识图谱

1,何为知识图谱

通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。

2,知识图谱这个网络具备的特性:

2.1 由节点(Point)和边(Edge)组成

2.2 每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系

2.3 知识图谱是关系的最有效的表示方式

3 知识图谱能干什么?

先按知识图谱应用的深度主要可以分为两大类:

一是通用知识图谱,通俗讲就是大众版,没有特别深的行业知识及专业内容,一般是解决科普类、常识类等问题。

二是行业知识图谱,通俗讲就是专业版,根据对某个行业或细分领域的深入研究而定制的版本,主要是解决当前行业或细分领域的专业问题。

2,python如何构建知识图谱?

2.1,javaJDK安装

1,JDK下载(neo4j要求11以上jdk) 下载慢 https://www.oracle.com/java/technologies/downloads/ csdn下载较快 https://download.csdn.net/download/h735004790/12256491

2, JDK安装

1,新建文件夹作为安装文件夹

2,双击jdk-14_windows-x64_bin.exe进行安装

3,下一步

4,配置环境变量

安装目录的bin目录 F:\Java\bin

3,验证

2.2 Neo4j安装

1,下载 https://neo4j.com/download-center/

2,选择 3,解压

4,设置环境变量

F:\neo4j-community-4.4.5\bin\neo4j.bat 5,验证

neo4j.bat console

出现错误 解决: 打开neo4j.ps1文件里Import-Module "$PSScriptRoot\Neo4j-Management.psd1"为绝对路径 改为/: 验证:

neo4j.bat console

出现报错: 解决:

找到

改为jdk路径: 验证:

neo4j.bat console

成功:

2.3,设置图数据库密码

启动后在浏览器中键入http://localhost:7474/,进入以下界面。

用户名为neo4j,密码也是neo4j,连接后会让我们修改密码。这就是neo4j的启动与初始密码。

2.4 更新密码

2.5 python链接图数据库

from py2neo import Node, Graph, Relationship,NodeMatcher

class DataToNeo4j(object):

def __init__(self):

"""建立连接"""

link = Graph("http://localhost:7474", auth=("neo4j", "123456"))

self.graph = link

#self.graph = NodeMatcher(link)

# 定义label

self.buy = 'buy'

self.sell = 'sell'

self.graph.delete_all()

self.matcher = NodeMatcher(link)

def create_node(self, node_buy_key,node_sell_key):

"""建立节点"""

for name in node_buy_key:

buy_node = Node(self.buy, name=name)

self.graph.create(buy_node)

for name in node_sell_key:

sell_node = Node(self.sell, name=name)

self.graph.create(sell_node)

def create_relation(self, df_data):

"""建立联系"""

m = 0

for m in range(0, len(df_data)):

try:

print(list(self.matcher.match(self.buy).where("_.name=" + "'" + df_data['buy'][m] + "'")))

print(list(self.matcher.match(self.sell).where("_.name=" + "'" + df_data['sell'][m] + "'")))

rel = Relationship(self.matcher.match(self.buy).where("_.name=" + "'" + df_data['buy'][m] + "'").first(),df_data['money'][m], self.matcher.match(self.sell).where("_.name=" + "'" + df_data['sell'][m] + "'").first())

self.graph.create(rel)

except AttributeError as e:

print(e, m)

简单效果展示:

查看原文