Regex 如何使用正则表达式过滤Wikipedia Petscan API结果?
我使用的是wmflabs开发的一种叫做Petscan的工具。 这有助于您扫描维基百科类别下的所有文章或子类别 Petscan链接: 我正在尝试扫描类别下的所有文章:电视剧。虽然我能够获得该类别下的所有文章,但我需要应用正则表达式筛选标题以列表或列表开头的文章 petscan tool的输出选项卡中有一项规定,您可以在其中指定一个正则表达式来执行此操作 我试着用不同的正则表达式,但不知怎么的,它没能奏效 还有其他人用它来解决这样的用例吗。如果是,请告诉我怎么做。我试图搜索Petscan的文档,但它没有指定执行步骤Regex 如何使用正则表达式过滤Wikipedia Petscan API结果?,regex,wikipedia-api,Regex,Wikipedia Api,我使用的是wmflabs开发的一种叫做Petscan的工具。 这有助于您扫描维基百科类别下的所有文章或子类别 Petscan链接: 我正在尝试扫描类别下的所有文章:电视剧。虽然我能够获得该类别下的所有文章,但我需要应用正则表达式筛选标题以列表或列表开头的文章 petscan tool的输出选项卡中有一项规定,您可以在其中指定一个正则表达式来执行此操作 我试着用不同的正则表达式,但不知怎么的,它没能奏效 还有其他人用它来解决这样的用例吗。如果是,请告诉我怎么做。我试图搜索Petscan的文档,但
文档:也许您应该与该工具的负责人联系。它们(理想情况下)可以帮助您解决显式问题,还可以努力更新有关所用正则表达式引擎的文档。我从Hit&Trial中了解到的是,您只需在RegExp筛选器字段中输入要匹配的文章标题或以“|”分隔的多个标题。这将只返回与给定标题名匹配的项目。我对regexp一窍不通,但从混乱中可以看出,Petscan中提供的唯一功能似乎是匹配与字符串完全匹配的标题。见例。用另一种方法来实现这一点是非常简单的,尽管下载了整个list.PetScan是用Rust编写的,并且Rust的regex库不支持lookbehinds。