使用流式解析器遍历Freebase rdf数据转储中的实体

使用流式解析器遍历Freebase rdf数据转储中的实体,rdf,freebase,large-data,Rdf,Freebase,Large Data,如何使用流式解析器迭代Freebase RDF数据转储,并在PHP中打印每个实体的标题及其类型(type/object/type) 例如,外籍人士: 或新的XML读取器函数: 或者任何其他将解析Freebase RDF数据转储的流式解析器。您真的不需要流式XML解析器。Freebase RDF数据转储不是XML,它们是N-Triples,并且经过特殊格式化,因此您可以在选项卡上拆分它们。您只需打开文件,一次读一行,然后在选项卡上拆分每一行。Oh。我认为RDF是XML。啊,好的。令人惊叹的谢谢,我

如何使用流式解析器迭代Freebase RDF数据转储,并在PHP中打印每个实体的标题及其类型(type/object/type)

例如,外籍人士:

或新的XML读取器函数:


或者任何其他将解析Freebase RDF数据转储的流式解析器。

您真的不需要流式XML解析器。Freebase RDF数据转储不是XML,它们是N-Triples,并且经过特殊格式化,因此您可以在选项卡上拆分它们。您只需打开文件,一次读一行,然后在选项卡上拆分每一行。

Oh。我认为RDF是XML。啊,好的。令人惊叹的谢谢,我会在标签上把它们分开的@DjangoJohnson,尽管它可以用XML(RDF/XML格式)序列化。但是,同一个RDF图可以在RDF/XML中以多种不同的方式序列化,因此基于XML的“解决方案”是脆弱的和不可移植的。我错了吗,或者这就像您发布的第5个StackOverflow问题一样,是同一个问题吗?完全不知道如何做某事是很好的,但这不是一个充斥着问题的借口。只要雇一个能想出办法的人——freegorer.com(如果有这样一个网站的话)或者任何你喜欢的自由职业者网站。这不是一个编程问题。