Perl 有没有一种简单的方法可以从网页中提取内容?
我们的构建软件在构建失败时生成一个网页,并列出自上次构建以来已提交的用户。我想为我的团队成员提供一种解析页面的方法。例如:Perl 有没有一种简单的方法可以从网页中提取内容?,perl,parsing,scripting,Perl,Parsing,Scripting,我们的构建软件在构建失败时生成一个网页,并列出自上次构建以来已提交的用户。我想为我的团队成员提供一种解析页面的方法。例如: Commit 18e1bc67b7e3123987daf8c219a4fbe2003de4 by <a href="/user/bob.dole/">bob.dole</a></b><pre>1112233- Description on header is not
Commit
18e1bc67b7e3123987daf8c219a4fbe2003de4
by <a href="/user/bob.dole/">bob.dole</a></b><pre>1112233- Description on header is not carried forward to BD doc after PCPROJBILL is ran<br></pre></div></td></tr><tr><td width="16"><img title="The file was modified" height="16" alt="The file was modified" width="16" src="/static/fbfd5d7f/images/16x16/document_edit.png" /></td><td><a>pcbatch/projbill.cpp</a></td></tr><tr class="pane"><td colspan="2" class="changeset"><a name="detail54"></a><div class="changeset-message"><b>
提交
18e1bc67b7e3123987daf8c219a4fbe2003de4
by 1112233-在运行PCPROJBILL后,标头上的说明不会结转至BD doc
pcbatch/projbill.cpp
因此,脚本将URL作为输入,在文件中搜索“bob.dole”,并将与他相关的所有详细信息(提交哈希、预数据等)输出到文件中
有人能告诉我什么是实现这一目标最简单的方法吗?我在考虑使用perl,但我不确定是否有更直接的方法。如果我正确回答了您的问题,您希望获取网页内容并对其进行解析以找到用户名。如果是这样,我会使用
php
使用(“您的网站”),这将返回一个字符串供您解析。然后可以使用
strps()
查找子字符串的索引。这将帮助您稍后使用substr()
函数提取用户名
希望有帮助。您正在寻找的基于节点搜索的Perl模块是。那么您想获取网页并为bob.dole解析它吗?我正确地理解了你的问题吗?是的,基本上-如果我能想出如何将网页放入某种流中,我想我可以从那里处理它。但是如果有当前的工具可以让我基于节点进行搜索(例如,