Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/regex/19.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何从使用python的简历中获得经验?_Python_Regex_Python 2.7_Nltk - Fatal编程技术网

如何从使用python的简历中获得经验?

如何从使用python的简历中获得经验?,python,regex,python-2.7,nltk,Python,Regex,Python 2.7,Nltk,我使用正则表达式提取了邮件id、电话号码 我已经使用核心NLP服务器提取了名称 我通过在一组单词中给出并比较单词来提取技能。 但是我不知道如何提取多年使用python的经验- 有人能告诉我关于这件事的想法吗? 示例: 2年工作经验 两年的工作经验 2010-2014年 像这样,有太多的可能性你可以采取几种方法。如果有很多可能性,如你所说,你可以将其视为一个机器学习问题,并使用方法1。否则1,如果可能性有限(例如,大约5),则可以使用第二种方法 方法1: 将其视为一个机器学习问题。根据是否包含经验

我使用正则表达式提取了邮件id、电话号码 我已经使用核心NLP服务器提取了名称 我通过在一组单词中给出并比较单词来提取技能。 但是我不知道如何提取多年使用python的经验- 有人能告诉我关于这件事的想法吗? 示例:

2年工作经验

两年的工作经验

2010-2014年


像这样,有太多的可能性

你可以采取几种方法。如果有很多可能性,如你所说,你可以将其视为一个机器学习问题,并使用方法1。否则1,如果可能性有限(例如,大约5),则可以使用第二种方法

方法1:

将其视为一个机器学习问题。根据是否包含经验年份,将文本中的每个句子分类为0或1。这可以通过手动训练一些数据来完成。针对每个培训示例,您将指定一个标签。例如:

工作经验:3年(标签1)

学习两年(标签0)

努力工作多年(标签0)

两年工作经验(标签1)

经验:2010-2014(标签1)

有了大量示例后,您可以使用
skicit learn
或类似的软件包来训练模型

方法2:

1-搜索数年。或者,它可以是确切的单词(
year
years
),也可以是四位数字(例如,2014)

2-如果
1
通过,在附近搜索单词experience(或类似的词)


如果
1
2
都通过了,那么您有多年的经验。然后,根据需要,您可以进一步提取。

您可以采取几种方法。如果有很多可能性,如你所说,你可以将其视为一个机器学习问题,并使用方法1。否则1,如果可能性有限(例如,大约5),则可以使用第二种方法

方法1:

将其视为一个机器学习问题。根据是否包含经验年份,将文本中的每个句子分类为0或1。这可以通过手动训练一些数据来完成。针对每个培训示例,您将指定一个标签。例如:

工作经验:3年(标签1)

学习两年(标签0)

努力工作多年(标签0)

两年工作经验(标签1)

经验:2010-2014(标签1)

有了大量示例后,您可以使用
skicit learn
或类似的软件包来训练模型

方法2:

1-搜索数年。或者,它可以是确切的单词(
year
years
),也可以是四位数字(例如,2014)

2-如果
1
通过,在附近搜索单词experience(或类似的词)



如果
1
2
都通过了,那么您有多年的经验。然后,根据你想要什么,你可以进一步提取。

你所说的这么多可能性是什么意思,最后,您需要找到预期模式背后的逻辑,例如它周围的字符串,或者如果预期模式的形状受到限制,您可以在多种方式上使用这些结构,如regex。@Kasramvd列出的3种方式都是列出经验的替代方法,可能没有“许多”方式,但是在所有的模式中并没有一个真正的模式,主要是前两个好的,但是唯一的方法是使用正则表达式,或者我们可以使用任何其他的logic@cricket_007是的,似乎是这样。也许有其他方法不用正则表达式,例如,拆分文本并处理较小的部分,或者您可以使用正则表达式来缓解问题,并使用其他函数来获得真正的结果。关键是,你需要调查你正在处理的文本,并详细说明问题的各个方面。问题是目前你的信息有缺陷,我再也帮不上忙了。如果你想得到一个正确的答案,你最好用更多的信息更新你的问题。你所说的这么多可能性是什么意思,最后,您需要找到预期模式背后的逻辑,例如它周围的字符串,或者如果预期模式的形状受到限制,您可以在多种方式上使用这些结构,如regex。@Kasramvd列出的3种方式都是列出经验的替代方法,可能没有“许多”方式,但是在所有的模式中并没有一个真正的模式,主要是前两个好的,但是唯一的方法是使用正则表达式,或者我们可以使用任何其他的logic@cricket_007是的,似乎是这样。也许有其他方法不用正则表达式,例如,拆分文本并处理较小的部分,或者您可以使用正则表达式来缓解问题,并使用其他函数来获得真正的结果。关键是,你需要调查你正在处理的文本,并详细说明问题的各个方面。问题是目前你的信息有缺陷,我再也帮不上忙了。如果你想得到一个正确的答案,你最好用更多的信息更新你的问题。是的,简历可以显示一个日期范围内的单词体验,但我认为这个问题是在寻求一种不需要特定格式输入数据的方法。无论如何,列出某一工作的日期范围绝对是展示多年经验的有效方式。正如我在回答中所证明的,所有的可能性都有一个模式。不管怎样,另一种方法是使用机器学习,我在回答中添加了机器学习。你能解释一下方法1吗?因为我是机器学习新手。扩展了我的答案。在这里使用经过训练的分类器似乎真是太过分了。是的,简历可以显示一个日期范围内的单词体验,但我认为