Nlp 如何获取带有工作标题注释的数据集?

Nlp 如何获取带有工作标题注释的数据集?,nlp,entity,named,Nlp,Entity,Named,我需要它来做一些实体提取。如何获得带有作业标题的带注释的数据集?如果您没有遇到任何数据集,我建议您这样做。抓取维基百科的职业列表:,创建一个工作的目录列表,并编写正则表达式来捕获这些工作或文本中的任何变化,您已经对数据进行了注释:)。您是否先自己做过任何研究或实验?这个问题对这个论坛来说太广泛了。是的,但我什么也没找到。不清楚你想要什么类型的数据集。你需要一份有职位的名单吗?或者你需要一个手工标注职位的原始文本吗?好的……什么是职位?您试图提取哪些实体?再一次……这个问题需要人们提供具体的帮助。

我需要它来做一些实体提取。如何获得带有
作业标题的带注释的数据集?

如果您没有遇到任何数据集,我建议您这样做。抓取维基百科的职业列表:,创建一个工作的目录列表,并编写正则表达式来捕获这些工作或文本中的任何变化,您已经对数据进行了注释:)。

您是否先自己做过任何研究或实验?这个问题对这个论坛来说太广泛了。是的,但我什么也没找到。不清楚你想要什么类型的数据集。你需要一份有职位的名单吗?或者你需要一个手工标注职位的原始文本吗?好的……什么是职位?您试图提取哪些实体?再一次……这个问题需要人们提供具体的帮助。我需要在工作标题的注释处添加rawtext,或者她可以从维基百科构建语料库:当随机维基页面中的链接链接到某个职业维基页面时,她在原始文本中发现了一个职业。