C# 使用正则表达式和c从文本中提取变量#_C#_Regex

C# 使用正则表达式和c从文本中提取变量#

c# regex

C# 使用正则表达式和c从文本中提取变量#,c#,regex,C#,Regex,我面前可能有一个简单的任务，但我的正则表达式技能很差。有人能帮我吗，或者给我指出正确的方向吗？：-）我正在解析的示例文本，我想对结果进行foreach，从中可以得到变量“URL”和介于两者之间的文本： Lorem ipsum door sit amet，concertetur[URL=/test.aspx？ID=12345]Lorem 伊普苏姆[/URL]一位精英。内华达州莫里斯市伊莱芬德国际水道佐料nisi lacinia sit amet。奥奇莫里斯·福西布斯 ac[URL=/Defau

我面前可能有一个简单的任务，但我的正则表达式技能很差。有人能帮我吗，或者给我指出正确的方向吗？：-）

我正在解析的示例文本，我想对结果进行foreach，从中可以得到变量“URL”和介于两者之间的文本：

Lorem ipsum door sit amet，concertetur[URL=/test.aspx？ID=12345]Lorem 伊普苏姆[/URL]一位精英。内华达州莫里斯市伊莱芬德国际水道佐料nisi lacinia sit amet。奥奇莫里斯·福西布斯 ac[URL=/Default.aspx？ID=2222222]lorem[/URL]convallis voliverpat，dolor 自由的独立自主者，我是大封建主义者 orci[URL=/Default.aspx？ID=333333]lorem ipsum dolor[/URL]quis augue。整数nec euismod sem

这应该可以为您做到：

Regex theRegex = new Regex(@"\[URL=([^\]]+)\]([^\[]+)\[/URL\]");
string text = "Lorem ipsum dolor sit amet, consectetur[URL=/test.aspx?ID=12345]lorem ipsum[/URL] adipiscing elit. Nullam interdum eleifend mauris, nec condimentum nisi lacinia sit amet. Mauris faucibus, orci ac[URL=/Default.aspx?ID=222222]lorem[/URL] convallis volutpat, dolor libero sollicitudin quam, id feugiat magna orci[URL=/Default.aspx?ID=333333]lorem ipsum dolor[/URL] quis augue. Integer nec euismod sem.";
MatchCollection matches = theRegex.Matches(text);
foreach (Match thisMatch in matches)
{
//        thisMatch.Groups[0].Value is e.g. "[URL=/test.aspx?ID=12345]lorem ipsum[/URL]"
//        thisMatch.Groups[1].Value is e.g. "/test.aspx?ID=12345"
//        thisMatch.Groups[2].Value is e.g. "lorem ipsum"

}

这应该可以为您做到：

Regex theRegex = new Regex(@"\[URL=([^\]]+)\]([^\[]+)\[/URL\]");
string text = "Lorem ipsum dolor sit amet, consectetur[URL=/test.aspx?ID=12345]lorem ipsum[/URL] adipiscing elit. Nullam interdum eleifend mauris, nec condimentum nisi lacinia sit amet. Mauris faucibus, orci ac[URL=/Default.aspx?ID=222222]lorem[/URL] convallis volutpat, dolor libero sollicitudin quam, id feugiat magna orci[URL=/Default.aspx?ID=333333]lorem ipsum dolor[/URL] quis augue. Integer nec euismod sem.";
MatchCollection matches = theRegex.Matches(text);
foreach (Match thisMatch in matches)
{
//        thisMatch.Groups[0].Value is e.g. "[URL=/test.aspx?ID=12345]lorem ipsum[/URL]"
//        thisMatch.Groups[1].Value is e.g. "/test.aspx?ID=12345"
//        thisMatch.Groups[2].Value is e.g. "lorem ipsum"

}

如果你的文本看起来像这样，这类事情就会起作用。您没有嵌套的URL，您的

URL

标记都是大写的

 "\[URL=([^\]]*)\]([^\[]*\)\[/URL\]"

这应该捕获两个组：1=

URL=

之后的内容，2=

[URL]…[\URL]

标记之间的内容

基本上

由于
```
[
```
和
```
]
```
是保留的令牌，要匹配它们，您需要添加前缀通过反斜杠（即“逃离”它们）
```
[^\[]
```
匹配任何非开括号的字符
括号确定可以捕获的组

警告：嵌套的URL标记不起作用，本身包含方括号的标记不起作用，带引号的字符串

“…”

也应该不带括号-也就是说，它们不会像正确的标记解析器那样被处理

据我所知，解决这类问题的唯一方法是进行完全解析

但是如果你确定数据没有这些异常，你就没事了！