Named entity recognition 是不是;合并财务数据“;及;表格8-K“;类似的法律术语是否被视为命名实体(用于命名实体识别)?

Named entity recognition 是不是;合并财务数据“;及;表格8-K“;类似的法律术语是否被视为命名实体(用于命名实体识别)?,named-entity-recognition,ner,edgar,Named Entity Recognition,Ner,Edgar,谢谢你的帮助。我正在做一些命名实体标记,遇到了一些模棱两可的术语。 我主要遵循CoNLL2003注释指南和MUC-7命名实体定义(其他注释指南大多与这些指南有相同的想法) 例如“我在北美和南美做生意”,我应该如何标记“北美和南美”?整个短语作为一个“位置”实体,或“北美洲”和“南美洲”作为两个“位置”实体 我在为一些法律报告(美国证券交易委员会的EDGAR数据集)添加标签,因此我遇到了诸如“表格10”、“表格8-K”之类的短语,它们是美国公司的法律表格类型。这些是否应被视为“杂项”命名实体

谢谢你的帮助。我正在做一些命名实体标记,遇到了一些模棱两可的术语。 我主要遵循CoNLL2003注释指南和MUC-7命名实体定义(其他注释指南大多与这些指南有相同的想法)

例如“我在北美和南美做生意”,我应该如何标记“北美和南美”?整个短语作为一个“位置”实体,或“北美洲”和“南美洲”作为两个“位置”实体

我在为一些法律报告(美国证券交易委员会的EDGAR数据集)添加标签,因此我遇到了诸如“表格10”、“表格8-K”之类的短语,它们是美国公司的法律表格类型。这些是否应被视为“杂项”命名实体

在这些表格中有章节名称,如“合并财务报表”、“管理层的讨论和分析”,这些是否应标记为“杂项”

如果是,那么“年度报告”、“股东年会”、“普通股”、“限制性股票单位”等短语就变得相当模糊。可以说,它们是一类“法律文件”的名称,或是“金融工具”的名称。但这些短语在某种程度上是通用的,并没有指出一个具体的实体。它们应该是“杂项”还是“在命名实体之外”(不是命名实体)