Java-使用正则表达式从文档中提取数据
我有一个简历数据集,我想从每个简历中提取数据 我将举一个例子来说明我需要什么Java-使用正则表达式从文档中提取数据,java,regex,Java,Regex,我有一个简历数据集,我想从每个简历中提取数据 我将举一个例子来说明我需要什么 String test= "Worked in Innovision Information System Private Limited as Project Trainee-Content Writing from Date to Date."; 我想提取公司名称、角色(名称)和日期(从到) 我是新加入regex的,如果我错了,请纠正我 第一件事,我试图分别提取它们中的每一个 String regexStr5="
String test= "Worked in Innovision Information System Private Limited as Project Trainee-Content Writing from Date to Date.";
我想提取公司名称
、角色(名称)
和日期(从到)
我是新加入regex的,如果我错了,请纠正我
第一件事,我试图分别提取它们中的每一个
String regexStr5="Worked in:? \\w+" ;
String regexStr6 ="as:? ([a-zA-Z ]+)";
对于日期日期:(一月|二月|三月|四月|五月|六月|七月|八月|九月|十月|十一月|十二月){1,2}、{4}
我怎么能把它们放在同一个正则表达式里?!!
并打印
公司名称+角色+日期
对于上述测试字符串,文本字符串匹配就可以了
Regex:作为(.*)从(.*)到(.*)在(.*)中工作。
替换任务:公司名称:\1\n角色(名称):\2\n日期:\3至\4
所有简历中的测试字符串都是这样结构的吗?不,绝对不是,但这是我从一份简历中提取的样本,很难匹配模式。正则表达式是上下文无关的,这意味着它不像我们那样理解。您必须输入模式语法以匹配这些语法。您可以像这样匹配字符串。那么我的演示正则表达式是否适合您的需要呢?是的,它非常完美,thanx,很抱歉打扰您,但您能写下您的答案来接受它吗:))