发布以合并Clueweb09注释数据和Freebase转储数据

发布以合并Clueweb09注释数据和Freebase转储数据,freebase,Freebase,我使用RDFs并将其与。但是,我面临以下问题: clueweb09-en0000-00-00011 ISO-8859-1英语17964 17980 0.999813 0.000165/m/02h40lc 但是,当我使用(Java和Ubuntu)读取Freebase转储数据时,当我读取gz文件时,会提到mid。我想知道我做错了什么,或者我应该手动将/m.02h40lc更改为/m/02h40lc。是的,在处理当前数据转储时,需要将标识符中的所有斜杠(/)替换为句点(.)。此转换对于使包含标识符的UR

我使用RDFs并将其与。但是,我面临以下问题:

clueweb09-en0000-00-00011 ISO-8859-1英语17964 17980 0.999813 0.000165/m/02h40lc


但是,当我使用(Java和Ubuntu)读取Freebase转储数据时,当我读取gz文件时,会提到mid。我想知道我做错了什么,或者我应该手动将/m.02h40lc更改为/m/02h40lc

是的,在处理当前数据转储时,需要将标识符中的所有斜杠(/)替换为句点(.)。此转换对于使包含标识符的URI正常工作是必要的。这不仅适用于MID,还适用于用于类型、名称空间等的其他标识符。例如,类型/对象/名称在数据转储中变为type.object.name。

是的,在处理当前数据转储时,需要将标识符中的所有斜杠(/)替换为句点(.)。此转换对于使包含标识符的URI正常工作是必要的。这不仅适用于MID,还适用于用于类型、名称空间等的其他标识符。例如,类型/对象/名称在数据转储中变为type.object.name