Regex 使用和服实验室进行正则表达式解析_Regex_Web Scraping

Regex 使用和服实验室进行正则表达式解析

regex web-scraping

Regex 使用和服实验室进行正则表达式解析,regex,web-scraping,Regex,Web Scraping,我试图使用和服实验室提供的软件从网站上获取文章列表及其链接。我遇到的问题是，我从网站上抓取的一个字符串有一个日期以及一些我无法从日期中分离出来的文本 Kimono对正则表达式使用以下语法： /^（）（.*）（）$/ 第一个括号=>位于所需内容的左侧第二个括号=>这是应该提取的内容第三个括号=>位于所需内容的右侧具体而言，我正在尝试创建的网站是：下面是我试图解析的行的一个示例（我只想要日期）： Enero 082016 我试图解析这一行没有结果，我尝试了阅读regex参考资料，但它们对

我试图使用和服实验室提供的软件从网站上获取文章列表及其链接。我遇到的问题是，我从网站上抓取的一个字符串有一个日期以及一些我无法从日期中分离出来的文本

Kimono对正则表达式使用以下语法：

/^（）（.*）（）$/

第一个括号=>位于所需内容的左侧

第二个括号=>这是应该提取的内容

第三个括号=>位于所需内容的右侧

具体而言，我正在尝试创建的网站是：

下面是我试图解析的行的一个示例（我只想要日期）：

Enero 082016

我试图解析这一行没有结果，我尝试了阅读regex参考资料，但它们对我来说相当复杂

任何建议都将不胜感激

Kimono期望的正则表达式需要有三个组（一个组是一对括号）。这意味着您始终需要保持这种结构：

/^()(.*?)()$/

这是和服的默认设置，第一组为空，第二组包含所有文本（

匹配任何字符，

*？

基本上表示“任意次数”），第三组再次为空

您可以调整这种安排，在开始和结束时删除不需要的文本-数据中的值始终是中间组匹配的值

我怀疑您当前获得的值如下所示：

Enero 07, 2016 La Primera 因此，用英语：

第一组保持空，开始时没有截止线
第二组匹配任何字符，但在匹配四位数字后停止
第三组匹配值的剩余部分；和服会扔掉那个副弦

在regex101中使用表达式：

Hi！如果我的答案解决了你的问题，你应该把它标记为接受。如果这对你没有帮助，你应该留下评论。在任何情况下，不做出任何反应都被认为是粗鲁的。 Enero 07, 2016 La Primera

/^()(.*?\d{4})(.*)$/