Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/csharp/300.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C# 单个正则表达式,除去锚以外的所有HTML_C#_Asp.net_Regex - Fatal编程技术网

C# 单个正则表达式,除去锚以外的所有HTML

C# 单个正则表达式,除去锚以外的所有HTML,c#,asp.net,regex,C#,Asp.net,Regex,这个版本在这里已经被问过好几次了,使用它们我可以得到两个不同的ReGex语句 一个剥离所有HTML的程序 1. <[^>]*> 1.]*> 还有一个可以去掉所有东西,除了锚标签 2. <a[^>]*>([^<]+)<\/a> 2。我需要的一切都是大写字母和周围的锚。不管我自己的评论;)-这就是你想要的吗 替换 <((?!a|\/a)[^>]*)>\s* ]*)>\s* 使用空字符串 开场后的负面展望我看不到任何问号

这个版本在这里已经被问过好几次了,使用它们我可以得到两个不同的ReGex语句

一个剥离所有HTML的程序

1. <[^>]*>
1.]*>
还有一个可以去掉所有东西,除了锚标签

2. <a[^>]*>([^<]+)<\/a>

2。我需要的一切都是大写字母和周围的锚。

不管我自己的评论;)-这就是你想要的吗

替换

<((?!a|\/a)[^>]*)>\s*
]*)>\s*
使用空字符串


开场后的负面展望
我看不到任何问号?有些表达式可能会这样做,但也请提供您的工具/编程语言。有关支持
(*SKIP)(*FAIL)
的引擎,请参阅,但请注意,嵌套结构(例如
HTML
)容易出错。@Jan my bad假设Regex在任何地方都是相同的。这个对我来说失败了,因为一个“量词{x,y}什么都不跟在后面。”但是谢谢你会研究它。关于]*>([^令人惊讶的是,没有人喊“不要用正则表达式解析HTML!”)是的。如果它对测试数据起作用,它确实起作用了,这就是我想要的。谢谢你。当然]*>\s*是一个好的开始,所以+1,但是它在细节上更复杂。如果您有类似的文本或任何其他以开头的标记“@quant除了span、head、meta和常见的疑点之外,我的html标记都不是以a开头的,更不用说包含a了。所以对于我的特殊情况,它工作得非常完美。@quant它可以被增强为不匹配
alt
,只需添加一个单词boundary-
]*)>\s*
Sam你是个英雄。。。(但是等一下,不是已经有一个叫山姆的英雄了吗?)