Ruby 只处理HTML片段并返回它
当我对Nokogiri执行以下操作时:Ruby 只处理HTML片段并返回它,ruby,nokogiri,Ruby,Nokogiri,当我对Nokogiri执行以下操作时: some_html = '<img src="bleh.jpg"/>test<br/>' f = Nokogiri::HTML(some_html) #do some processing puts f 我只想要内部/碎片部分: <img src=\"bleh.jpg\">test<br> 测试 您所说的“html”部分是什么意思 只需执行f.text()即可获得内部文本 使用Nokogiri::HTML
some_html = '<img src="bleh.jpg"/>test<br/>'
f = Nokogiri::HTML(some_html)
#do some processing
puts f
我只想要内部/碎片部分:
<img src=\"bleh.jpg\">test<br>
测试
您所说的“html”部分是什么意思
只需执行
f.text()
即可获得内部文本 使用Nokogiri::HTML(…)
而不是使用Nokogiri::HTML::fragment(…)
:
asdf=Nokogiri::HTML::fragment('test
'))
打印asdf.to_html
#>>测试
这是一个风格问题,但就我个人而言,我觉得Nokogiri::HTML.fragment没有Nokogiri::HTML::fragment那么让人困惑——它看起来不像打字错误;)Ruby样式指南建议使用
而不是:
来调用类方法,因此Nokogiri::HTML.fragment
显然是首选。
<img src=\"bleh.jpg\">test<br>
asdf = Nokogiri::HTML::fragment('<img src="bleh.jpg">test<br>')
print asdf.to_html
# >> <img src="bleh.jpg">test<br>