Regex 智胜中心标记和前瞻可能?
代码如下:Regex 智胜中心标记和前瞻可能?,regex,parsing,web-scraping,Regex,Parsing,Web Scraping,代码如下: <div>23 Anywhere Ave<br />Someplace<br />Somewhere 1234</div> 23 Anywhere Ave某地某地1234 我想刮去最后的三条线 23 Anywhere Ave<br />Someplace<br />Somewhere 1234</div> 23 Anywhere Ave某地某地1234 分成不同的列。通过将设置为前标记,将设置
<div>23 Anywhere Ave<br />Someplace<br />Somewhere 1234</div>
23 Anywhere Ave
某地
某地1234
我想刮去最后的三条线
23 Anywhere Ave<br />Someplace<br />Somewhere 1234</div>
23 Anywhere Ave
某地
某地1234
分成不同的列。通过将
设置为前标记,将
设置为后标记,我可以刮取第一个字符串(23 Anywhere Ave)。
在那之后就被卡住了。我尝试将前标记设置为(?=)
)
,/(?=)
)/
(在进行正则表达式语句时显然需要//巧妙地进行设置),以及/(?=)/
)
以获得第二个值,但运气不佳
我意识到正则表达式不适合解析HTML,但表明它在Outwit体系结构中的某些上下文中是可以的 在自动机/刮板机中放置此分隔符:br 然后在标签列表中:街道、城市、ZipCode 比尔,
Eusebio。你能发布一个到源URL的链接吗?看来以前关于这个问题的通信被删除了。放弃了,我现在用刮痧。不管怎样,谢谢你的关注。看看我们正在做什么,你可能会发现它很有用。@Andrew Fogg-我现在使用import.io,它涵盖了我想在OP中实现的目标