Python 使用py2neo将大型XML文件导入neo4j

Python 使用py2neo将大型XML文件导入neo4j,python,xml,neo4j,py2neo,Python,Xml,Neo4j,Py2neo,我有一个非常大的XML文件(2Gb),我正试图用Python将其上传到neo4j。我正在编一本字典 mydata = etree.parse("myfile.xml") data = mydata.getroot() data_list = {} temp_elt = {} #will hold each element j=0 for pub in data: for elt in pub.getchildren(): temp_elt[elt.tag] =

我有一个非常大的XML文件(2Gb),我正试图用Python将其上传到neo4j。我正在编一本字典

mydata = etree.parse("myfile.xml")
data = mydata.getroot()

data_list = {}
temp_elt = {} #will hold each element

j=0
for pub in data:    
    for elt in pub.getchildren():
        temp_elt[elt.tag] = elt.text 
    data_list[j] = temp_elt  
    j=j+1
    temp_elt = {}
这不会花费很长时间(考虑到大量数据)

然后我尝试上传到neo4j:

graph = Graph("http://localhost:7474/db/data/")
graph.delete_all()

for element in data_list:
    authnode = Node("Person",author=data_list[element]["author"])
    pubnode = Node(data_list[element]["type"],title=data_list[element]["title"])

    graph.merge(authnode)
    graph.merge(pubnode)

    graph.merge(Relationship(authnode,"wrote",pubnode))
这部分需要几天,如果不是几周的话

我发现最相似的问题是: 但是,这里建议将xml文件转换为csv文件,这本身至少需要一周的时间,因此csv不是一个选项

其他人建议使用Geoff格式,但是load2neo驱动程序已经有一段时间没有更新了,我似乎无法安装它

有什么建议吗