Ruby 如何从已注释的HTML标记中提取文本
我有一个我用Nokogiri解析过的页面,但是我需要从一个注释过的标签中获取文本。HTML格式如下:Ruby 如何从已注释的HTML标记中提取文本,ruby,xpath,nokogiri,Ruby,Xpath,Nokogiri,我有一个我用Nokogiri解析过的页面,但是我需要从一个注释过的标签中获取文本。HTML格式如下: <div class="parent"> <div class="child"> <span class="visible"> hello </span> <!-- <span class="commented"> hi </span> --> </div> </div&
<div class="parent">
<div class="child">
<span class="visible"> hello </span>
<!-- <span class="commented"> hi </span> -->
</div>
</div>
仅运行:
page.xpath("//div[@class='parent']/div[@class='child']/comment()")
给出:
[#<Nokogiri::XML::Comment:0x3fe466d8d634 " <span class=\"commented\">hi </span> ">]
[#]
我没有办法尝试如何获取
hi
文本。我不是Nokogiri专家,但类似的方法似乎有效
comment_node = Nokogiri::HTML(page.at("//div[@class='parent']/div[@class='child']/comment()").text)
comment_node.text.strip
=> "hi"
我不是Nokogiri的专家,但类似的方法似乎有效
comment_node = Nokogiri::HTML(page.at("//div[@class='parent']/div[@class='child']/comment()").text)
comment_node.text.strip
=> "hi"
是的。喜欢这个,是的。喜欢这个xD