Nlp 从文本中提取产品属性/特征

Nlp 从文本中提取产品属性/特征,nlp,feature-extraction,named-entity-recognition,named-entity-extraction,Nlp,Feature Extraction,Named Entity Recognition,Named Entity Extraction,我被指派了一项任务,从产品描述中提取特征/属性 Levi Strauss slim fit jeans Big shopping bag in pink and gold 我需要能够提取出属性,如“牛仔裤”和“修身”或“购物袋”和“粉色”和“金色”。 产品描述列表不仅仅针对服装,它们基本上可以是任何东西 我不知道如何处理这个问题。我尝试实现一个命名实体识别器解决方案和一个POS实现,NER实现无法识别任何令牌,并且大多数令牌在POS解决方案中显示为NNP(专有名词),这对我没有多大帮助。我需要

我被指派了一项任务,从产品描述中提取特征/属性

Levi Strauss slim fit jeans
Big shopping bag in pink and gold
我需要能够提取出属性,如“牛仔裤”和“修身”或“购物袋”和“粉色”和“金色”。 产品描述列表不仅仅针对服装,它们基本上可以是任何东西

我不知道如何处理这个问题。我尝试实现一个命名实体识别器解决方案和一个POS实现,NER实现无法识别任何令牌,并且大多数令牌在POS解决方案中显示为NNP(专有名词),这对我没有多大帮助。我需要一种能够区分品牌名称和产品特征的方法(如t恤、颜色或设计(圆领、v领)等)

我确实实现了一个KMean解决方案,它将类似的产品聚集在一起,但这并不是我想要的结果


只是想找个人给我指引正确的方向。

你可以利用基于方面的情绪分析(ABSA)的最新进展。这个领域有一个分支提取方面和观点术语。方面类似于属性(实体/产品/服务的特性)。意见就是该属性的价值。例如,在这句话中:“这家餐厅供应的食物很好,员工也很友好”,有两个方面/意见对:{(“食物”,“好”),(“员工”,“友好”)}

ABSA传统上用于用户评论,但谁知道呢?它在这里也能起作用。您需要了解的唯一一件事是ABSA中的所有解决方案都是特定于领域的,这意味着您需要为一个特定领域培训您的模型,即案例中的“服装”。将其推广到多个领域已经显示出很差的结果,ans仍然是一个活跃的研究领域


我希望这会有所帮助

有一些论文在讨论这个话题,比如OpenTag认为这是一个序列标记问题。

当然k-means不会起作用。您需要的是面向语言的过程,而不是统计方法。不要关注数据挖掘和机器学习领域(这里没有学习),而是关注语言方法并尝试使用外部数据。嘿,这方面有什么更新吗?解决几乎相同的问题。您是否提前知道属性和特性?