Java dbpediaspotlight数据集

Java dbpediaspotlight数据集,java,dbpedia,spotlight-dbpedia,Java,Dbpedia,Spotlight Dbpedia,我从安装了dbpediaspotlight,并希望通过从下载来改进其数据集 有人能告诉我如何将spotter词典和消歧索引中的数据与jar文件一起使用。假设您已经下载并解压缩了以下文件: wget http://spotlight.dbpedia.org/download/release-0.5/context-index-compact.tgz tar zxvf context-index-compact.tgz wget http://spotlight.dbpedia.org/downlo

我从安装了dbpediaspotlight,并希望通过从下载来改进其数据集


有人能告诉我如何将spotter词典和消歧索引中的数据与jar文件一起使用。

假设您已经下载并解压缩了以下文件:

wget http://spotlight.dbpedia.org/download/release-0.5/context-index-compact.tgz
tar zxvf context-index-compact.tgz
wget http://spotlight.dbpedia.org/download/release-0.4/surface_forms-Wikipedia-TitRedDis.uriThresh75.tsv.spotterDictionary.gz
gunzip surface_forms-Wikipedia-TitRedDis.uriThresh75.tsv.spotterDictionary.gz
现在,您只需更改server.properties文件以指向新提取的文件:

org.dbpedia.spotlight.index.dir = index-withSF-withTypes-compressed
org.dbpedia.spotlight.spot.dictionary = surface_forms-Wikipedia-TitRedDis.uriThresh75.tsv.spotterDictionary
如果您使用的是最大的spotter dict,则可能需要增加java堆空间,例如命令行中的-Xmx10G。

非常感谢Pablo.)我对深入了解Dbpedia Spotlight项目感兴趣。我参考了官方dbpedia站点上的文档,并正在寻找技术实现。