带逻辑/上下文规则的quanteda字典(cf Wordstat&“x27”s“邻近规则”)

带逻辑/上下文规则的quanteda字典(cf Wordstat&“x27”s“邻近规则”),r,quanteda,R,Quanteda,在使用quanteda进行文本分析之前,我使用了Provalis Wordstat。当使用字典方法时,Wordstat允许用户在字典中包括常规术语和邻近规则(例如:“苏丹”不在“南部”;“刚果”不在“民主共和国”之后)。有没有可能在quanteda中应用类似的功能?朋友们建议通过正则表达式执行一些排除规则,但我不知道如何实现它 虽然我不太熟悉编写正则表达式(或任何使之可行的选项),但我的想法是: # example for dictionary with names of 2 african c

在使用quanteda进行文本分析之前,我使用了Provalis Wordstat。当使用字典方法时,Wordstat允许用户在字典中包括常规术语和邻近规则(例如:“苏丹”不在“南部”;“刚果”不在“民主共和国”之后)。有没有可能在quanteda中应用类似的功能?朋友们建议通过正则表达式执行一些排除规则,但我不知道如何实现它

虽然我不太熟悉编写正则表达式(或任何使之可行的选项),但我的想法是:

# example for dictionary with names of 2 african countries
africa_dict <- dictionary(list(algeria="algeria",
                             republic_of_the_congo=c("republic_of_the_congo", "congo_(NOT AFTER democratic_republic_of_the_)")))

#包含两个非洲国家名称的词典示例

我知道这个问题。实施邻近规则并不容易,但我有一个想法。我知道这个问题,请加入我们的讨论。实施邻近规则并不容易,但我有一个想法。请加入我们的讨论