Regex 智胜中心标记和前瞻可能？_Regex_Parsing_Web Scraping

Regex 智胜中心标记和前瞻可能？

regex parsing web-scraping

Regex 智胜中心标记和前瞻可能？,regex,parsing,web-scraping,Regex,Parsing,Web Scraping,代码如下： <div>23 Anywhere Ave<br />Someplace<br />Somewhere 1234</div> 23 Anywhere Ave某地某地1234 我想刮去最后的三条线 23 Anywhere Ave<br />Someplace<br />Somewhere 1234</div> 23 Anywhere Ave某地某地1234 分成不同的列。通过将设置为前标记，将设置

代码如下：

<div>23 Anywhere Ave<br />Someplace<br />Somewhere 1234</div>

23 Anywhere Ave
某地
某地1234

我想刮去最后的三条线

23 Anywhere Ave<br />Someplace<br />Somewhere 1234</div>

23 Anywhere Ave
某地
某地1234

分成不同的列。通过将

设置为前标记，将

设置为后标记，我可以刮取第一个字符串（23 Anywhere Ave）。在那之后就被卡住了。我尝试将前标记设置为

（？=）
）

，

/（？=）
）/

（在进行正则表达式语句时显然需要//巧妙地进行设置），以及

/（？=）/
）

以获得第二个值，但运气不佳

我意识到正则表达式不适合解析HTML，但表明它在Outwit体系结构中的某些上下文中是可以的

在自动机/刮板机中放置此分隔符：br 然后在标签列表中：街道、城市、ZipCode

比尔，

Eusebio。

你能发布一个到源URL的链接吗？看来以前关于这个问题的通信被删除了。放弃了，我现在用刮痧。不管怎样，谢谢你的关注。看看我们正在做什么，你可能会发现它很有用。@Andrew Fogg-我现在使用import.io，它涵盖了我想在OP中实现的目标