在线新闻网站的RDF数据

在线新闻网站的RDF数据,rdf,semantics,Rdf,Semantics,我想得到不同语言的主要新闻网站的列表。是否有任何提供商以RDF格式提供大多数主要网站详细信息?DBpedia包含来自Wikipedia的信息,并具有SPARQL端点。维基百科中有一些相关的分类可以帮助你找到你想要的信息。例如,我们可以选择单个新闻站点并获得302个结果: SELECT * WHERE { ?newsSite dcterms:subject category:News_websites . } 可靠地获取其他信息有点困难,因为某些信息可能不适用于某个页面,或者相同的信息

我想得到不同语言的主要新闻网站的列表。是否有任何提供商以RDF格式提供大多数主要网站详细信息?

DBpedia包含来自Wikipedia的信息,并具有SPARQL端点。维基百科中有一些相关的分类可以帮助你找到你想要的信息。例如,我们可以选择单个新闻站点并获得302个结果:

SELECT * WHERE { 
  ?newsSite dcterms:subject category:News_websites .
} 

可靠地获取其他信息有点困难,因为某些信息可能不适用于某个页面,或者相同的信息可能存在于具有不同属性的不同页面上。例如,其中一些页面使用
dbpprop:web

SELECT * WHERE { 
  ?newsSite dcterms:subject category:News_websites .
  OPTIONAL { ?newsSite dbpprop:web ?web }
}

其他人使用
dbpprop:website
。您可以将上一个查询中的
dbpprop:web
替换为
dbpprop:web | dbpprop:website
,尽管这在DBpedia端点上运行缓慢。您可以更详细地使用此选项:

SELECT ?newsSite ?web WHERE { 
  ?newsSite dcterms:subject category:News_websites .
  OPTIONAL { 
    { ?newsSite dbpprop:web ?web }
    UNION
    { ?newsSite dbpprop:website ?web }

  }
} 

这仍然只能获得这些页面中的一小部分的网站。还有一些使用了
dbpprop:url
,因此我们有以下内容:

SELECT ?newsSite ?web WHERE { 
  ?newsSite dcterms:subject category:News_websites .
  OPTIONAL { 
    { ?newsSite dbpprop:web ?web }
    UNION
    { ?newsSite dbpprop:website ?web }
    UNION 
    { ?newsSite dbpprop:url ?web }
  }
} 

RSS1.0是纯RDF,因此您可以寻找提供该功能的网站。否则,您可以尝试搜索与新闻相关的类或属性。我猜《纽约时报》会出现,因为他们涉及到rNews词汇表,可以用在微数据中或HTML中的RDFa来标记文章等。等等,你要求的是一组关于新闻组织的三重数据…@BenCompanjen,是的,我正在尝试找出所有(或尽可能多的)新闻网站。我正在构建一个应用程序,我想知道哪一个是新闻网站。如果是新闻网站,那么我必须禁用页面缓存。因此,如果我随身携带新闻域,那么我不会缓存这些新闻站点的所有页面。这不是像这样的编程问答的主题吗?对不起,我不知道必须提问的问题的范围。谢谢你提醒我。非常感谢。。我会用这个。