Python:使用Wikidata选择位置和地点的Wikipedia页面

Python:使用Wikidata选择位置和地点的Wikipedia页面,python,geolocation,wikidata,ner,entity-linking,Python,Geolocation,Wikidata,Ner,Entity Linking,我有一个与某些实体相关的维基百科页面列表,我只想选择地理位置(城市、省份,还有地区、山脉、河流等) 我可以很容易地选择带有坐标的页面,但这还不够,因为维基百科中的许多地方实际上都与坐标无关。我想我应该使用Wikidata中的标签,但我从未使用过它们,我对Python API有点迷茫。例如,如果我使用wptools: import wptools page = wptools.page('Indianapolis') print(page.get_wikidata()) 我得到这个: www.w

我有一个与某些实体相关的维基百科页面列表,我只想选择地理位置(城市、省份,还有地区、山脉、河流等)

我可以很容易地选择带有坐标的页面,但这还不够,因为维基百科中的许多地方实际上都与坐标无关。我想我应该使用Wikidata中的标签,但我从未使用过它们,我对Python API有点迷茫。例如,如果我使用wptools:

import wptools
page = wptools.page('Indianapolis')
print(page.get_wikidata())
我得到这个:

www.wikidata.org (wikidata) Indianapolis
www.wikidata.org (labels) Q1000136|P1830|P421|Q1093829|P163|Q2579...
www.wikidata.org (labels) Q537853|P281|P949|Q2494513|Q3166162|Q18...
www.wikidata.org (labels) P1036|Q499547|P1997|P31|P17|P268|Q62049...
en.wikipedia.org (imageinfo) File:IndianapolisC12.png
Indianapolis (en) data
{
  aliases: <list(10)> Circle City, Indy, Naptown, Crossroads of Am...
  claims: <dict(61)> P1082, P227, P1151, P31, P17, P131, P163, P41...
  description: <str(109)> city in and county seat of Marion County...
  image: <list(1)> {'file': 'File:IndianapolisC12.png', 'kind': 'w...
  label: Indianapolis
  labels: <dict(145)> Q1000136, P1830, P421, Q1093829, P163, Q2579...
  modified: <dict(1)> wikidata
  requests: <list(5)> wikidata, labels, labels, labels, imageinfo
  title: Indianapolis
  what: county seat
  wikibase: Q6346
  wikidata: <dict(61)> population (P1082), GND ID (P227), topic's ...
  wikidata_pageid: 7459
  wikidata_url: https://www.wikidata.org/wiki/Q6346
}
www.wikidata.org(wikidata)印第安纳波利斯
www.wikidata.org(标签)Q1000136 | P1830 | P421 | Q1093829 | P163 | Q2579。。。
www.wikidata.org(标签)Q537853 | P281 | P949 | Q2494513 | Q316162 | Q18。。。
www.wikidata.org(标签)P1036 | Q499547 | P1997 | P31 | P17 | P268 | Q62049。。。
en.wikipedia.org(imageinfo)文件:IndianapolisC12.png
印第安纳波利斯(en)数据
{
别名:环城、印地、纳普敦、阿姆河十字路口。。。
权利要求书:P1082,P227,P1151,P31,P17,P131,P163,P41。。。
描述:马里恩县的城市和县城。。。
图片:{'file':'file:IndianapolisC12.png','kind':'w。。。
标签:印第安纳波利斯
标签:Q1000136,P1830,P421,Q1093829,P163,Q2579。。。
修改:wikidata
请求:wikidata、标签、标签、标签、图像信息
标题:印第安纳波利斯
什么:县城
维基库:Q6346
维基数据:人口(P1082),GND ID(P227),主题。。。
wikidata_pageid:7459
wikidata_url:https://www.wikidata.org/wiki/Q6346
}
如何仅提取标签? 我想存在一个标签“这是一个位置”,但如何使用它?
在SPARQL中提前感谢

询问{schema:about?item.?item wdt:P31/wdt:P279+wd:Q618123}
好的,如果我只有关于维基百科页面id的信息,那么我非常感谢!