Powershell:splithtml
我有一个自己生成的HTML文件(在本地目录中),所有正文都在一行上:Powershell:splithtml,html,windows,powershell,split,Html,Windows,Powershell,Split,我有一个自己生成的HTML文件(在本地目录中),所有正文都在一行上: <html><head><META http-equiv="Content-Type" content="text/html; charset=UTF-8"><title>server - path</title></head><body><H1>server - path</H1>
<html><head><META http-equiv="Content-Type" content="text/html; charset=UTF-8"><title>server - path</title></head><body><H1>server - path</H1><hr>
<pre><A HREF="/logs/folder/">[To Parent Directory]</A><br><br> jeudi 5 janvier 2017 19:38 116483 <A HREF="/folder/file1.csv">file1.csv</A><br> jeudi 5 janvier 2017 19:39 138397 <A HREF="/folder/file2.csv">file2.csv</A></A><br></pre><hr></body></html>
server-pathserver-path
朱迪5号2017年1月19日:38 116483
朱迪5号2017年1月19日:39 138397
我需要提取文件名和日期。
我读对了。但我无法在
上拆分该行
我试着这样做:
first line<br>second line <br> third line<br> end<br>
fi
st line
second line
thi
d line
end
$string=“第一行
第二行
第三行
结束
”
写入主机$string
$separator=“
”
$option=[System.StringSplitOptions]::RemoveEmptyEntries
$string.Split($separator,$option)
但我的结果是:
PS C:\> $String -split $separator |Where-Object {$_}
first line
second line
third line
end
第一行
第二行
第三行
结束
fi
st线
第二线
这
d线
结束
我看到了HTML敏捷包,但在我的例子中,我的页面中没有任何标记
你有什么建议吗?
谢谢 接受字符串
并将其视为[char]
数组,在每次出现
时进行拆分
请改用基于正则表达式的-split
运算符:
Where对象{$}
管道元素将过滤掉空字符串这篇文章似乎回答了您的问题:
PS C:\> $String -split $separator |Where-Object {$_}
first line
second line
third line
end