.net 在DBPedia中使用WebClient和browser会产生不同的结果
我想提取一些存在于中的信息。因此,我使用.NET的System.NET.WebClient编写了一个应用程序,它获取url并以N-Triples格式(纯文本)返回url的内容 为(应用程序)提取数据的结果为:.net 在DBPedia中使用WebClient和browser会产生不同的结果,.net,c#-4.0,rdf,sparql,dbpedia,.net,C# 4.0,Rdf,Sparql,Dbpedia,我想提取一些存在于中的信息。因此,我使用.NET的System.NET.WebClient编写了一个应用程序,它获取url并以N-Triples格式(纯文本)返回url的内容 为(应用程序)提取数据的结果为: 。“阿富汗通讯”@en。 但是,当我使用浏览器查看时,我从中提取的内容非常不同 我与Fiddler核对了请求,然后: 添加(HttpRequestHeader.UserAgent,“Mozilla/4.0(兼容;MSIE 6.0;Windows NT 5.2;.NET CLR 1.0.3
。“阿富汗通讯”@en。
但是,当我使用浏览器查看时,我从中提取的内容非常不同
我与Fiddler核对了请求,然后:
添加(HttpRequestHeader.UserAgent,“Mozilla/4.0(兼容;MSIE 6.0;Windows NT 5.2;.NET CLR 1.0.3705;)”
DBPedia是将应用程序检测为bot并返回比真实浏览器更少的数据,还是我错过了其他东西 您的应用程序要求的当然是:
http://dbpedia.org/data/AfghanistanCommunications.ntriples
但您的Web浏览器显示的是:
http://dbpedia.org/data/Communications_in_Afghanistan.ntriples
如果您使用Web浏览器,如果您转到或,您将被重定向到,除非请求特定格式。重定向的原因是Wikipedia有一个从到的重定向。您可以在应用程序中获得的三元组中看到:
<http://dbpedia.org/ontology/wikiPageRedirects>
<http://dbpedia.org/ontology/wikiPageRedirects>