如何在Nokogiri Ruby中卸载HTML,so&;余留及;而不是&;amp;

如何在Nokogiri Ruby中卸载HTML,so&;余留及;而不是&;amp;,ruby,nokogiri,Ruby,Nokogiri,我有一个标题doc.at('head/title')。里面的html出来了&,它应该是& 我的原始文件是: <head><title>Foo & Bar</title></head> 这既难看又不方便。使用内容而不是内部html来获取纯文本内容,而不是(X)html >> doc = Nokogiri::HTML.parse(file, nil, "UTF-8") >> doc.at('head/title'

我有一个标题
doc.at('head/title')。里面的html
出来了
&,它应该是
&

我的原始文件是:

<head><title>Foo & Bar</title></head>

这既难看又不方便。

使用
内容
而不是
内部html
来获取纯文本内容,而不是(X)html

>> doc = Nokogiri::HTML.parse(file, nil, "UTF-8")
>> doc.at('head/title')
=> #<Nokogiri::XML::Element:0x..fdb851bea name="title" children=#<Nokogiri::XML::Text:0x..fdb850808 "Foo & Bar">>
>> doc.at('head/title').inner_html
=> "Foo &amp; Bar"
>> require 'cgi'
>> CGI.unescapeHTML(doc.at('head/title').inner_html)
=> "Foo & Bar"
irb(main):011:0> doc.at('head/title').content
=> "Foo & Bar"