C#正则表达式过滤器问题_C#_.net_Regex_Winforms

C#正则表达式过滤器问题

c# .net regex winforms

C#正则表达式过滤器问题,c#,.net,regex,winforms,C#,.net,Regex,Winforms,此时此刻，我在早些时候发布了一些关于Regex的问题。它让我头疼，我查阅了大量关于如何使用regex的文档，但我仍然无法找到它。我不想再浪费6个小时来过滤简单的（我想）表达式因此，基本上我要做的是过滤所有以HTML扩展名结尾的文件类型（星号“*”来自Winforms选项卡控件，表示文件已被修改。我在IgnoreCase中也需要它们： .html, .htm, .shtml, .shtm, .xhtml .html*, .htm*, .shtml*, .shtm*, .xhtml* 同时过滤一

此时此刻，我在早些时候发布了一些关于

Regex

的问题。它让我头疼，我查阅了大量关于如何使用regex的文档，但我仍然无法找到它。我不想再浪费6个小时来过滤简单的（我想）表达式

因此，基本上我要做的是过滤所有以HTML扩展名结尾的文件类型（星号“*”来自Winforms选项卡控件，表示文件已被修改。我在

IgnoreCase

中也需要它们：

.html, .htm, .shtml, .shtm, .xhtml
.html*, .htm*, .shtml*, .shtm*, .xhtml*

同时过滤一些CSS文件：

.css
.css*

和一些SQL文件：

.sql, .ddl, .dml
.sql*, .ddl*, .dml*

我前面的问题得到了筛选Python文件的答案：

.py, .py, .pyi, .pyx, .pyw
Expression would be: \.py[3ixw]?\*?$

但是当我试图从上面的表达式学习时，我总是只打开一个

.xhtml

，其余的都无效

对于HTML表达式，我现在有这样一个：

\.HTML |.HTML |.shtml |.shtml |.xhtml\*？$

带有

RegexOptions.IgnoreCase

。但是输出将只允许

.xhtml

区分大小写的..HTML文件.htm和其他文件不匹配。我非常感谢您对每个表达式的解释德（所以我再也不用问同样的问题了）

谢谢。

对于这种情况，您可以从一个简单的正则表达式开始，它可以逐步简化为一个好的正则表达式：

在C#中，对于IgnoreCase，这基本上是

Regex myRegex = new Regex("PATTERN", RegexOptions.IgnoreCase);

现在的模式是：最简单的模式是将所有有效结果与OR+转义（如果可能）连接起来：

使用

.html*

时，您的意思是

.html

+任何东西，在正则表达式中写为

（任何字符，0-无限次）

\.html|\.htm|\.shtml|\.shtm|\.xhtml|\.html.*|\.htm.*|\.shtml.*|\.shtm.*|\.xhtml.*

然后，您可以将所有重复模式组合在一起。所有文件结尾都以点开头，并且可能有可选的结尾，

结尾。*

始终包含

结尾

：

\.(html|htm|shtml|shtm|xhtml).*

然后，我经常看到

htm

，所以我尝试提取它。将

htm

前后所有可能的字符一起提取（

？

表示0或1个字符）：

而且，我总是检查它是否还在工作

这样，您还可以得到其他两个正则表达式，并最终将它们合并在一起。

对于这种情况，您可以从一个简单的正则表达式开始，该正则表达式可以逐步简化为一个好的正则表达式：