分割一个html文件,在ruby中只保留分隔符上方的部分

分割一个html文件,在ruby中只保留分隔符上方的部分,ruby,regex,file,split,Ruby,Regex,File,Split,我有一个html文件,其中包含一个充当分隔符的字符串,我想 -拆分此文件并仅保留分隔符上方的部分 -关闭新文件中所有打开的html标记 使用ruby(或unix)并保持其效率的最佳方法是什么 提前谢谢 Nicolas如果我正确理解了您的问题,您要做的是将HTML文件中位于分隔符之前的部分存储在字符串中,例如: <html> <head> <title>Blah</title> </head> <body>

我有一个html文件,其中包含一个充当分隔符的字符串,我想 -拆分此文件并仅保留分隔符上方的部分 -关闭新文件中所有打开的html标记

使用ruby(或unix)并保持其效率的最佳方法是什么

提前谢谢
Nicolas

如果我正确理解了您的问题,您要做的是将HTML文件中位于分隔符之前的部分存储在字符串中,例如:

<html>
  <head>
    <title>Blah</title>
  </head>
  <body>
     <p>Some stuff</p>
        <!-- Delimiter --!>
  </body>
</html>

废话
一些东西


对于Unix版本,可以使用perl one liner,如下所示:

perl -n -e 'print if $delim;
            $delim=1 if ($delim or /<!-- Delimeter --!>/);' html_file >output
perl-n-e'print if$delim;

$delim=1如果($delim或/Hello,谢谢你的快速回答。你已经正确理解了我的请求。我将测试你的代码并让你知道它是否有效。谢谢毛里兹,我使用了ruby代码,但我会记住你的解决方案。
perl -n -e 'print if $delim;
            $delim=1 if ($delim or /<!-- Delimeter --!>/);' html_file >output