neo4j搭建豆瓣电影top250知识图谱踩过的坑
neo4j 4.0.1
重置neo4j
将安装地址data文件夹中两个文件夹databases和transactions直接删除,再启动neo4j,进入浏览器会回到最开始的输入原始用户名和密码 neo4j neo4j,之前创建的数据库会清空,只剩下初始的数据库neo4j和system。
csv文件规范
节点文件(以director.csv为例):第一列为index:ID,最后一列为:LABEL(实体的标签),中间列为实体属性。注意实体属性最好用英文表示。
关系文件(以directed.csv为例):第一列为:START_ID(相当于关系的实施者的index:ID),此处为director的index:ID;第二列为:END_ID(相当于关系的实施对象的index:ID),此处为film的index:ID;第三列为relation(关系),此处为directed;第四列为:TYPE(关系类型),此处为directed。一般来说,关系和关系类型区别不是很大,可以一致。
导入csv文件注意点
导入文件之前停止neo4j
在bin文件夹下运行导入语句,如:
neo4j-admin import --database movies --nodes import/actor.csv --nodes import/director.csv --nodes import/filmName.csv --nodes import/type.csv --relationships import/act.csv --relationships import/direct.csv --relationships import/belongto.csv --relationships import/cooperation.csv
这里是在bin文件夹中新建了一个import文件夹用来存放csv文件。
导入的这个movies数据库之前是不存在的,在导入的时候自动创建。
导入成功之后将conf文件夹中的neo4j.conf文件打开,将#dbms.default_database=neo4j改成dbms.default_database=movies,也就是将#去掉,将neo4j改成movies。这句话的意思是修改默认数据库,也就是打开浏览器之后显示的数据库默认是movies。
遇到的问题
启动了neo4j之后,没几秒自己关闭了,导致打不开浏览器网页。
原因应该是之前只删除了data文件夹中的databases文件夹,没有删除transactions文件夹,transactions中还留着之前创建的几个数据库,导致两个文件夹的数据不一致。直接删除这两个文件夹之后就可以重置neo4j了。
文件头示例
节点文件
|index:ID|music|:LABEL|
关系文件
|:START_ID|:END_ID|relation|:TYPE|
