Ruby 如何从锚点列表中搜索“/aems/dic/list”?
我有以下代码,它是html的一部分:Ruby 如何从锚点列表中搜索“/aems/dic/list”?,ruby,mechanize,selenium-webdriver,Ruby,Mechanize,Selenium Webdriver,我有以下代码,它是html的一部分: <td><a href="http://youtube.com">YouTube</a></td> <td><a data-category="news" href=http://kathack.com/party/aems/dic/list">Reddit</a></td> <td><a href="http://kathack.com/par
<td><a href="http://youtube.com">YouTube</a></td>
<td><a data-category="news" href=http://kathack.com/party/aems/dic/list">Reddit</a></td>
<td><a href="http://kathack.com/party/aems">Kathack</a></td>
<td><a data-category="news" href="http://www.nytimes.com">New York Times</a></td>
现在,我如何搜索
/aems/dic/list
并存储完整的url?因此,使用nokogiri
,类似这样的内容:
fragment = Nokogiri::HTML::DocumentFragment.parse text
fragment.css("a").each do |link|
href = link['href']
return href if href =~ /\/aems\/dic\/list/
end
假设您有一个Mechanize::Page对象
Page
:
page.at('a[href*="/aems/dic/list"]')[:href]
#=> "http://kathack.com/party/aems/dic/list"
更新
举一个较长的例子:
require 'mechanize'
agent = Mechanize.new
page = agent.get 'http://www.example.com/'
page.at('a[href*="/aems/dic/list"]')[:href]
#=> "http://kathack.com/party/aems/dic/list"
对于类似的任务,我可以使用
nokogiri
gem我可以用一些代码来看看如何完成它吗?可以使用selenium webdriver来完成吗?假设我有一个网站www.example.com
,它有一个网页,并且所提到的内容是页面的一部分,那么我应该如何编写它?请分享一点想法。因为我从来没用过nokogiri<代码>+1给你:)你能给我一个完整的代码吗?意思是假设所提到的描述html
是网页www.example.com
的一部分,那么如何开始?只是想看看我到现在为止只使用了selenium
。以及良好的文档,在这里我可以看到更多关于Mechanize
的示例,了解如何使用它的过程。关于如何使用文档,您有什么好的建议吗?我是第一次看到这样的文档。基本上我是从甲骨文领域。我在使用doc时遇到的基本问题是,并非所有的过程都有一个小代码来解释语法。所以如何做这样的作业,了解什么程序可以在代码中如何使用。doc的代码如此之小,程序也不多,并非所有的程序都如此。有什么建议吗。我真的很想了解这个平台,但是文档有时有用,有时没有。至于文档,我能说的就是也许你会习惯它。通常检查一个对象的方法就足以知道如何使用它了。你能说一下-你从哪里得到的'a[href*=“/aems/dic/list”][:href]
?我想知道这个概念,这样我就可以将ti用于其他需求,如果有的话!