Java-使用正则表达式从文档中提取数据

Java-使用正则表达式从文档中提取数据,java,regex,Java,Regex,我有一个简历数据集,我想从每个简历中提取数据 我将举一个例子来说明我需要什么 String test= "Worked in Innovision Information System Private Limited as Project Trainee-Content Writing from Date to Date."; 我想提取公司名称、角色(名称)和日期(从到) 我是新加入regex的,如果我错了,请纠正我 第一件事,我试图分别提取它们中的每一个 String regexStr5="

我有一个简历数据集,我想从每个简历中提取数据 我将举一个例子来说明我需要什么

String test= "Worked in Innovision Information System Private Limited as Project Trainee-Content Writing from Date to Date.";
我想提取
公司名称
角色(名称)
日期(从到)

我是新加入regex的,如果我错了,请纠正我

第一件事,我试图分别提取它们中的每一个

String regexStr5="Worked in:? \\w+" ;
String regexStr6 ="as:? ([a-zA-Z ]+)";  
对于日期
日期:(一月|二月|三月|四月|五月|六月|七月|八月|九月|十月|十一月|十二月){1,2}、{4}

我怎么能把它们放在同一个正则表达式里?!!
并打印
公司名称+角色+日期

对于上述测试字符串,文本字符串匹配就可以了

Regex:
作为(.*)从(.*)到(.*)在(.*)中工作。

替换任务:
公司名称:\1\n角色(名称):\2\n日期:\3至\4


所有简历中的测试字符串都是这样结构的吗?不,绝对不是,但这是我从一份简历中提取的样本,很难匹配模式。正则表达式是上下文无关的,这意味着它不像我们那样理解。您必须输入模式语法以匹配这些语法。您可以像这样匹配字符串。那么我的演示正则表达式是否适合您的需要呢?是的,它非常完美,thanx,很抱歉打扰您,但您能写下您的答案来接受它吗:))