Google api 如何提取Freebase中所有实体的名称和类型?

Google api 如何提取Freebase中所有实体的名称和类型?,google-api,freebase,named-entity-recognition,freebase-acre,Google Api,Freebase,Named Entity Recognition,Freebase Acre,我试图在Freebase dump中提取所有命名实体及其类型 我看过 但我并没有在Freebase dump中获得实际的命名实体 我想得到这样的信息, 姓名:巴拉克·奥巴马类型:个人 名称:纽约类型:城市等 Freebase的数据库中已经有了所有这些实体,但我没有找到任何Freebase API或Google API来列出所有实体及其类型 你能帮帮我吗 感谢对数据转储格式进行了描述。自从我写了你提到的答案后,它发生了一些变化,但基本原理仍然是一样的 和API都可以用于将Freebase主题过滤为

我试图在Freebase dump中提取所有命名实体及其类型

我看过 但我并没有在Freebase dump中获得实际的命名实体

我想得到这样的信息, 姓名:巴拉克·奥巴马类型:个人 名称:纽约类型:城市等

Freebase的数据库中已经有了所有这些实体,但我没有找到任何Freebase API或Google API来列出所有实体及其类型

你能帮帮我吗


感谢

对数据转储格式进行了描述。自从我写了你提到的答案后,它发生了一些变化,但基本原理仍然是一样的

和API都可以用于将Freebase主题过滤为特定类型(例如/people/person类型)。主题可以有多种类型,但如果您想要的是经典的NER类型,那么首先要做的可能是按所需的类型进行过滤,因为在数千万个主题中,Freebase中“只有”大约300万人


Freebase包含的信息比名称多得多,这在NER任务中非常有用,因此您可能需要后退一步,考虑您可能还需要提取哪些其他属性。

感谢您的回复。我一直在寻找主题到类别的映射,最终我能够使用WikiDump获得这样的映射。在那里我可以获得每个维基百科标题的类别。参考:我不确定您最终使用了该页面上的哪个DBpedia文件,但Freebase转储中也提供了相同的信息。DBpedia和Freebase有不同的优点和缺点,所以两者都值得一看。我使用wikipedia数据集实现查询分类,一开始我计划从Freebase获取类别图,因为它有更多的数据集。最后,我们决定使用wiki类别图。在dbpedia中,我使用了和文件。