Nlp 使用spacy的表格数据

Nlp 使用spacy的表格数据,nlp,spacy,ner,Nlp,Spacy,Ner,我正在使用Spacy,需要一些帮助来使用word/pdf文档中以表格格式给出的自定义实体来训练我们的模型 我可以用一个基于动物的例子的自定义实体来训练它,它工作得很好。在本例中,我们在给定文本中提供上述自定义实体的开始和结束索引 ("Horses are too tall and they pretend to care about your feelings", { 'entities': [(0, 6, 'ANIMAL')] }), 我的问题以表格形式出现: 如何给出动物示例等索引

我正在使用Spacy,需要一些帮助来使用word/pdf文档中以表格格式给出的自定义实体来训练我们的模型

我可以用一个基于动物的例子的自定义实体来训练它,它工作得很好。在本例中,我们在给定文本中提供上述自定义实体的开始和结束索引

("Horses are too tall and they pretend to care about your feelings", {
    'entities': [(0, 6, 'ANIMAL')]
}),
我的问题以表格形式出现:
如何给出动物示例等索引?
有人能给我指导和帮助吗


经过大量的研究和文章,我找到了一种方法让它通过

  • 将此表转换为文本
  • 当您将其转换为文本时。这将添加大量空白等
  • 将它们替换为空格
  • 这将把表转换为段落
  • 现在,您可以将索引作为句子,并训练您的模型

  • 此外,您可以使用依赖项解析器算法来查找与head链接的正确值(如果一个值属于多个键)

    您也可以简单地使用pd.read_html([[pass your html here]]),这将返回您可以使用的数据帧列表


    谢谢。

    您是如何在这里使用依赖项解析器算法的?有代码示例吗?