分割一个html文件,在ruby中只保留分隔符上方的部分
我有一个html文件,其中包含一个充当分隔符的字符串,我想 -拆分此文件并仅保留分隔符上方的部分 -关闭新文件中所有打开的html标记 使用ruby(或unix)并保持其效率的最佳方法是什么 提前谢谢分割一个html文件,在ruby中只保留分隔符上方的部分,ruby,regex,file,split,Ruby,Regex,File,Split,我有一个html文件,其中包含一个充当分隔符的字符串,我想 -拆分此文件并仅保留分隔符上方的部分 -关闭新文件中所有打开的html标记 使用ruby(或unix)并保持其效率的最佳方法是什么 提前谢谢 Nicolas如果我正确理解了您的问题,您要做的是将HTML文件中位于分隔符之前的部分存储在字符串中,例如: <html> <head> <title>Blah</title> </head> <body>
Nicolas如果我正确理解了您的问题,您要做的是将HTML文件中位于分隔符之前的部分存储在字符串中,例如:
<html>
<head>
<title>Blah</title>
</head>
<body>
<p>Some stuff</p>
<!-- Delimiter --!>
</body>
</html>
废话
一些东西
对于Unix版本,可以使用perl one liner,如下所示:
perl -n -e 'print if $delim;
$delim=1 if ($delim or /<!-- Delimeter --!>/);' html_file >output
perl-n-e'print if$delim;
$delim=1如果($delim或/Hello,谢谢你的快速回答。你已经正确理解了我的请求。我将测试你的代码并让你知道它是否有效。谢谢毛里兹,我使用了ruby代码,但我会记住你的解决方案。
perl -n -e 'print if $delim;
$delim=1 if ($delim or /<!-- Delimeter --!>/);' html_file >output