Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/72.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C# HTML标记的正则表达式_C#_Html_Regex - Fatal编程技术网

C# HTML标记的正则表达式

C# HTML标记的正则表达式,c#,html,regex,C#,Html,Regex,我试图找到一个正则表达式,它将匹配文本文件中的打开和关闭HTML标记。任何帮助都会很好,我所能想到的就是]*>,这是我最推荐的正则表达式。我应该提到,我使用的是VS2010和C#。AFAIK使用正则表达式不可能找到嵌套的html标记。例如,如果输入类似于某个短语双黑体另一个短语,则无法将正确的开头和结尾标记与正则表达式匹配。如果嵌套的级别是固定的和已知的,这是可能的,但由于HTML中不是这种情况,所以regex将不起作用。您认为需要以下内容。这包括用于自动关闭标记和关闭标记的选项 "</?

我试图找到一个正则表达式,它将匹配文本文件中的打开和关闭HTML标记。任何帮助都会很好,我所能想到的就是
]*>
,这是我最推荐的正则表达式。我应该提到,我使用的是VS2010和C#。

AFAIK使用正则表达式不可能找到嵌套的html标记。例如,如果输入类似于
某个短语双黑体另一个短语
,则无法将正确的开头和结尾标记与正则表达式匹配。如果嵌套的级别是固定的和已知的,这是可能的,但由于HTML中不是这种情况,所以regex将不起作用。

您认为需要以下内容。这包括用于自动关闭标记和关闭标记的选项

"</?[a-zA-z]* ?/?>"
“”

小心:这很有帮助,亲爱的,我的问题是嵌套的html标记具有无法预料的深度。你认为你的解决方案会解决问题吗@tichodromy“solution”肯定会解决你的“问题”。这取决于你想用什么语言来解析它。XML解析器将很好地工作。几乎所有的语言都有内置的XML解析器,或者很容易找到的库。我有一个html页面,我将其转换为文本文件,以便用正则表达式删除其中的一些标记,然后再次用html语言在同一个文本文件上完全重写它@Tarandeep Gillhtml不是一种编程语言,你不能用html读/写/修改文件。我在这里遗漏了一些东西,要么你在使用JavaScript,要么可能是像“grep”这样的命令?@TarandeepGill,我想他的意思是他将
foo.html
文件重命名为
foo.txt
。@TarandeepGill你可以轻松地读取html标记并将其写入文本文件什么不清楚?我的转换还是其他什么?我的问题是嵌套的html标记具有无法预料的深度。你认为你的解决办法能解决问题吗@Oliver@dav,使用HTML解析器处理这些事情,而不是使用正则表达式。如果你真的想用正则表达式来做这些事情,你可以看看这个正则表达式:@Qtax非常感谢,这很有帮助