C# 如何使用正则表达式拆分字符串。拆分并保留所有分隔符?

C# 如何使用正则表达式拆分字符串。拆分并保留所有分隔符?,c#,regex,string,C#,Regex,String,如何使用正则表达式拆分字符串。拆分并保留所有分隔符 我有一个字符串:“substring1 delimeter1 substring2”,其中delimeter+substring2是地址的一部分 此外,我还有2个或更多的delimeter:delim1,delim2在意义上是等价的 我想得到如下字符串数组: arr[0]="subsctring1"; arr[1]="delim1 subsctring2"; 或者 我有一个模式: addrArr= Regex.Split(inputText,

如何使用正则表达式拆分字符串。拆分并保留所有分隔符

我有一个字符串:“substring1 delimeter1 substring2”,其中delimeter+substring2是地址的一部分

此外,我还有2个或更多的delimeter:delim1,delim2在意义上是等价的

我想得到如下字符串数组:

arr[0]="subsctring1";
arr[1]="delim1 subsctring2";
或者

我有一个模式:

addrArr= Regex.Split(inputText, String.Concat("(?<=",delimeter1, "|",delimeter2, ")"), RegexOptions.None);

addrArr=Regex.Split(inputText,String.Concat(“(?您只需要一个具有前瞻性的模式:

\s+(?=delim1|delim2)
\s+
将匹配一个或多个空格(因为您的字符串包含空格)。如果没有空格,请使用
\s*
(但是您需要从结果中删除空条目)。请参阅。如果这些分隔符必须是整字,请使用
\b
字边界:
\s+(?=\b(?:delim1 | delim2)\b)

在C#中:

如果分隔符可以包含特殊的正则表达式元字符,则需要在
分隔符列表上运行
regex.Escape

A:

var inputText=“substring1 delim1 substring2 delim2 substr3”;
变量delimeters=新列表{“delim1”、“delim2”};
var addrArr=Regex.Split(inputText,
string.Format(@“\s+(?={0})”,string.Join(“|”,delimeters.Select(Regex.Escape));
Console.WriteLine(string.Join(“\n”,addrArr));

我认为您需要使用先行,而不是后视,这样才能工作(但还没有尝试过)

此外,必须小心使用分隔符;它们必须转义才能作为正则表达式中的模式正常工作

试试这个:

addrArr= Regex.Split(inputText, string.Format("(?={0}|{1})", Regex.Escape(delimeter1), Regex.Escape(delimeter2)), RegexOptions.None);

使用
Regex.Escape
,模式看起来像。但是,请注意,如果分隔符在开始/结束处可能包含非单词字符,您将无法使用
\b
,则需要一些自定义逻辑。
addrArr = Regex.Split(inputText, string.Format(@"\s+(?={0})", string.Join("|", delimeters)));
var inputText = "substring1 delim1 substring2 delim2 substr3";
var  delimeters = new List<string> { "delim1", "delim2" };
var addrArr = Regex.Split(inputText, 
        string.Format(@"\s+(?={0})", string.Join("|", delimeters.Select(Regex.Escape))));
Console.WriteLine(string.Join("\n", addrArr));
addrArr= Regex.Split(inputText, string.Format("(?={0}|{1})", Regex.Escape(delimeter1), Regex.Escape(delimeter2)), RegexOptions.None);