Java 转换批处理导入程序的平面csv
我正在尝试使用来上传一个大的csv(~20 mil行)。我被困在如何解析csv以使用导入器上。这是csv的外观:Java 转换批处理导入程序的平面csv,java,csv,neo4j,cypher,data-import,Java,Csv,Neo4j,Cypher,Data Import,我正在尝试使用来上传一个大的csv(~20 mil行)。我被困在如何解析csv以使用导入器上。这是csv的外观: CUSTOMER_NAME,TRANSACTION_DATE,TRANSACTION_NO,TRANSACTION_TYPE,COMPANY_TYPE,COMPANY_NAME,STREETNUM,STREETNAME,CITY,STATE,ZIPCODE 图形结构如下-我在浏览器中创建图形(太慢,有这么多行): 我需要使用多少个CSV?我可以用两个CSV(节点/rel)重新创建这
CUSTOMER_NAME,TRANSACTION_DATE,TRANSACTION_NO,TRANSACTION_TYPE,COMPANY_TYPE,COMPANY_NAME,STREETNUM,STREETNAME,CITY,STATE,ZIPCODE
图形结构如下-我在浏览器中创建图形(太慢,有这么多行):
我需要使用多少个CSV?我可以用两个CSV(节点/rel)重新创建这个图结构吗?如果是这样,我对这些特殊CSV的结构感到困惑。例如:
nodes.csv:
COMPANY:string:COMPANY,l:label,COMPANY:string:COMPANY_NAME,COMPANY:string:COMPANY_TYPE,COMPANY:string:STREETNUM,COMPANY:string:STREETNAME
^我在哪里包括其他节点
rels.csv
STATE:string:STATE,ZIPCODE:string:ZIPCODE,CITY,CITY:string:CITY
^如何包含完整路径(2+rels)或多个关系 neo4j批处理导入器要求将节点和边放在单独的csv文件中。 我建议您处理原始文件以生成nodes.csv和edges.csv文件,每个文件中仅包含节点和边 使用导入器时,还可以为节点和边指定多个文件,例如:
import.bat test.db“nodes1.csv,nodes2.csv”“edges1.csv,edges2.csv”
希望这能有所帮助。这是朝着正确方向迈出的一步。我无法获取要填充的节点属性,并且它跳过了关系的创建。
rels.csv
STATE:string:STATE,ZIPCODE:string:ZIPCODE,CITY,CITY:string:CITY