C# 用于提取要匹配的特定部分的正则表达式

C# 用于提取要匹配的特定部分的正则表达式,c#,regex,asp.net-mvc,itext,C#,Regex,Asp.net Mvc,Itext,我试图用正则表达式从字符串中提取某些数据。字符串如下所示: 这里有一些描述点 经历 公司名称 1年4个月 软件开发人员 2020年4月至今(1年1个月) 城市名称、州名称、国家名称 这里有一些描述点 StringBuilder sb=新建StringBuilder(); 字符串pdfData=string.Empty,pdfData2=string.Empty; Regex re=new Regex(regexpatern,RegexOptions.IgnoreCase); 使用(PdfRead

我试图用正则表达式从字符串中提取某些数据。字符串如下所示:

这里有一些描述点

经历

公司名称

1年4个月

软件开发人员

2020年4月至今(1年1个月)

城市名称、州名称、国家名称

这里有一些描述点

StringBuilder sb=新建StringBuilder();
字符串pdfData=string.Empty,pdfData2=string.Empty;
Regex re=new Regex(regexpatern,RegexOptions.IgnoreCase);
使用(PdfReader读取器=新PdfReader(路径))
{
对于(int pageNo=1;pageNo
我想在这个图案前画三行

我尝试了
stringregex模式=@“[ADFJMNOS][a-z]{2,8}\s[12][0-9]{3}\b”;


如果在模式字符串的开头插入
((.*\n){3})
match.Groups[1]
将在此模式前包含所需的三行。

您的模式不包含任何可以匹配之前行的内容,因此“April 2020”似乎是正确的匹配。你试图在这个模式之前获得这三行内容是什么?@ChristophLütjen我不知道如何创建这样的正则表达式模式,使我在模式之前获得这三行内容,这与你的正则表达式问题本身无关,但请记住,
SimpleTextExtractionStrategy
按我的顺序提取内容t出现在PDF内容流中,这不一定与它在页面上出现的顺序相同。因此,您会问“如何在我的正则表达式中包含换行符”?这个应该有帮助:谢谢Armali,它解决了我的问题,但是这个ragex模式在2020年1月不起作用为什么?它在2020年1月起作用-所以似乎还有其他的东西,也许在月和年之间有两个空格?-你可以很容易地在线测试它,例如,在这里:@Dev.Sab-如果你添加不起作用,我们应该能够看到原因排到提问栏。