Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/regex/17.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Regex 智胜中心标记和前瞻可能?_Regex_Parsing_Web Scraping - Fatal编程技术网

Regex 智胜中心标记和前瞻可能?

Regex 智胜中心标记和前瞻可能?,regex,parsing,web-scraping,Regex,Parsing,Web Scraping,代码如下: <div>23 Anywhere Ave<br />Someplace<br />Somewhere 1234</div> 23 Anywhere Ave某地某地1234 我想刮去最后的三条线 23 Anywhere Ave<br />Someplace<br />Somewhere 1234</div> 23 Anywhere Ave某地某地1234 分成不同的列。通过将设置为前标记,将设置

代码如下:

<div>23 Anywhere Ave<br />Someplace<br />Somewhere 1234</div>
23 Anywhere Ave
某地
某地1234
我想刮去最后的三条线

23 Anywhere Ave<br />Someplace<br />Somewhere 1234</div>
23 Anywhere Ave
某地
某地1234
分成不同的列。通过将
设置为前标记,将

设置为后标记,我可以刮取第一个字符串(23 Anywhere Ave)。 在那之后就被卡住了。我尝试将前标记设置为
(?=)
/(?=)
)/
(在进行正则表达式语句时显然需要//巧妙地进行设置),以及
/(?=)/
以获得第二个值,但运气不佳


我意识到正则表达式不适合解析HTML,但表明它在Outwit体系结构中的某些上下文中是可以的

在自动机/刮板机中放置此分隔符:br 然后在标签列表中:街道、城市、ZipCode

比尔,
Eusebio。

你能发布一个到源URL的链接吗?看来以前关于这个问题的通信被删除了。放弃了,我现在用刮痧。不管怎样,谢谢你的关注。看看我们正在做什么,你可能会发现它很有用。@Andrew Fogg-我现在使用import.io,它涵盖了我想在OP中实现的目标