Ruby 如果所需内容没有';你没有班级或身份证吗?

Ruby 如果所需内容没有';你没有班级或身份证吗?,ruby,parsing,web-scraping,nokogiri,Ruby,Parsing,Web Scraping,Nokogiri,我正试图抓取一些内容,并用Nokogiri解析它!我现在被打动了,因为我正在尝试获取一些文本内容,这些内容没有包含在任何类型的标记中。只需文本和一些标记,不需要任何类或id 我是否可以只搜索内容/文本的开头和结尾,然后在两者之间找到所有内容 <body> text <br/> <ul> <li>some more text </li> </body> 文本 更多的文字 CSS选择器或Xpath,任何解决方案都很好。需

我正试图抓取一些内容,并用Nokogiri解析它!我现在被打动了,因为我正在尝试获取一些文本内容,这些内容没有包含在任何类型的标记中。只需文本和一些标记,不需要任何类或id

我是否可以只搜索内容/文本的开头和结尾,然后在两者之间找到所有内容

<body>
text <br/>
<ul>
<li>some more text </li>
</body>

文本
  • 更多的文字
CSS选择器或Xpath,任何解决方案都很好。

需要“nokogiri”
require "nokogiri"

Nokogiri::HTML.parse(<<_).css("body").children.first.text
<body>
text <br/>
<ul>
<li>some more text </li>
</body>
_
# => "\ntext "


Nokogiri::HTML.parse(<<_).css("body").children.first.text.strip
<body>
text <br/>
<ul>
<li>some more text </li>
</body>
_
# => "text"

Nokogiri::HTML.parse(我不知道您在问什么,但我猜您使用的是术语“hook”以错误的方式。嘿,对不起!我刚刚删除了钩子部分!请看上面的html示例,我想要上面html的文本部分,它没有包含在div或任何类型的标记中。如何查找和读取此类内容?