python上下文中多个多词短语分类的NLP策略

python上下文中多个多词短语分类的NLP策略,python,machine-learning,nlp,Python,Machine Learning,Nlp,我想要一些帮助来选择NLP策略对日记账分录进行分类。下面是一个示例,说明日记账分录可能是什么样子,以及正确的分类应该是什么 “昨天,我睡得很糟。我觉得很累,所以我一天的工作效率不是很好。” 分类:“睡眠:糟糕”和“工作效率:不是很好” 我有一大套个人日记。人们将谈论他们做过(或试图做)的事情以及结果如何(“好”、“坏”)。每个条目将有多个尝试和评分,我需要正确匹配它们 现在,我可以采取的一种方法是在Python中使用Spacy的matcher,并提供一个多单词属性列表,如 # Initializ

我想要一些帮助来选择NLP策略对日记账分录进行分类。下面是一个示例,说明日记账分录可能是什么样子,以及正确的分类应该是什么

“昨天,我睡得很糟。我觉得很累,所以我一天的工作效率不是很好。”

分类:“睡眠:糟糕”和“工作效率:不是很好”

我有一大套个人日记。人们将谈论他们做过(或试图做)的事情以及结果如何(“好”、“坏”)。每个条目将有多个尝试和评分,我需要正确匹配它们

现在,我可以采取的一种方法是在Python中使用Spacy的matcher,并提供一个多单词属性列表,如

# Initialize the Matcher with the shared vocabulary
matcher = Matcher(nlp.vocab)

# Create a pattern matching two tokens: "iPhone" and "X"
pattern = [{'TEXT': 'not'}, {'TEXT': 'very'}, {'TEXT': 'good'}]
但是,问题是,即使我提出了一个新的评级和元素词典,我如何在上下文中匹配它们,比如正确的属性/形容词/评级与正确的元素(比如生产力或睡眠)


我相信有一种更有效的方法可以做到这一点,但我不太确定。任何帮助都会很好,如果我能让这个问题变得更好,请告诉我。

我会发表评论,但我的声誉太低,但这是一个非常有趣的NLP应用程序。如果你的杂志已经有了分类,我会研究ML方法。我最喜欢的文本分类工具是fasttext()


无论如何,祝你好运

欢迎来到StackOverflow,而且。。。在这里申请。请查收;您的问题对于堆栈溢出来说过于宽泛,但可能适合堆栈交换的其他地方。作为提示,您尝试做的技术名称是“基于方面的情绪分析”。这是一个积极研究的领域,你可能需要尝试一些东西,然后才能找到任何有效的方法(如果你这样做的话)。一个大问题是,你有一个固定的上下文列表,还是你想处理任何事情?