Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/regex/19.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Regex 如何使用正则表达式过滤Wikipedia Petscan API结果?_Regex_Wikipedia Api - Fatal编程技术网

Regex 如何使用正则表达式过滤Wikipedia Petscan API结果?

Regex 如何使用正则表达式过滤Wikipedia Petscan API结果?,regex,wikipedia-api,Regex,Wikipedia Api,我使用的是wmflabs开发的一种叫做Petscan的工具。 这有助于您扫描维基百科类别下的所有文章或子类别 Petscan链接: 我正在尝试扫描类别下的所有文章:电视剧。虽然我能够获得该类别下的所有文章,但我需要应用正则表达式筛选标题以列表或列表开头的文章 petscan tool的输出选项卡中有一项规定,您可以在其中指定一个正则表达式来执行此操作 我试着用不同的正则表达式,但不知怎么的,它没能奏效 还有其他人用它来解决这样的用例吗。如果是,请告诉我怎么做。我试图搜索Petscan的文档,但

我使用的是wmflabs开发的一种叫做Petscan的工具。 这有助于您扫描维基百科类别下的所有文章或子类别

Petscan链接:

我正在尝试扫描类别下的所有文章:电视剧。虽然我能够获得该类别下的所有文章,但我需要应用正则表达式筛选标题以列表或列表开头的文章

petscan tool的输出选项卡中有一项规定,您可以在其中指定一个正则表达式来执行此操作

我试着用不同的正则表达式,但不知怎么的,它没能奏效

还有其他人用它来解决这样的用例吗。如果是,请告诉我怎么做。我试图搜索Petscan的文档,但它没有指定执行步骤


文档:

也许您应该与该工具的负责人联系。它们(理想情况下)可以帮助您解决显式问题,还可以努力更新有关所用正则表达式引擎的文档。我从Hit&Trial中了解到的是,您只需在RegExp筛选器字段中输入要匹配的文章标题或以“|”分隔的多个标题。这将只返回与给定标题名匹配的项目。我对regexp一窍不通,但从混乱中可以看出,Petscan中提供的唯一功能似乎是匹配与字符串完全匹配的标题。见例。用另一种方法来实现这一点是非常简单的,尽管下载了整个list.PetScan是用Rust编写的,并且Rust的regex库不支持lookbehinds。