VB 2010读取HTML文本内部的INI

VB 2010读取HTML文本内部的INI,html,.net,vb.net,html-parsing,Html,.net,Vb.net,Html Parsing,我需要读取HTML文本中的INI文本,并使用Visual Basic 2010获取INI的每个部分 但它位于网站内部,在前后甚至内部都包含HTML标记,如下所示: ... more HTML <div ... > [inipart1]<br /> param1=1<br /> param2=text<br /> param3=Yes<br /> param4=link<br /> [inipart2]<br />

我需要读取HTML文本中的INI文本,并使用Visual Basic 2010获取INI的每个部分

但它位于网站内部,在前后甚至内部都包含HTML标记,如下所示:

... more HTML
<div ... >
[inipart1]<br />
param1=1<br />
param2=text<br />
param3=Yes<br />
param4=link<br />
[inipart2]<br />
param1=1<br />
param2=text<br />
param3=Yes<br />
param4=link
</div>
... more HTML
有人能帮我吗?非常感谢。

试试这个:

public string StripHtml(string text)
{
    return Regex.Replace(text, @"<(.|\n)*?>", "");
}
公共字符串StripHtml(字符串文本)
{
返回Regex.Replace(文本@“”);
}

PS:您必须包含System.Text.RegularExpressions名称空间

如果您可以确定INI值或参数不会包含任何大于或小于符号,那么您可以编写一个正则表达式来过滤掉所有HTML标记

public string StripHtml(string text)
{
    return Regex.Replace(text, @"<(.|\n)*?>", "");
}