带逻辑/上下文规则的quanteda字典（cf Wordstat&“x27”s“邻近规则”）_R_Quanteda

带逻辑/上下文规则的quanteda字典（cf Wordstat&“x27”s“邻近规则”）

带逻辑/上下文规则的quanteda字典（cf Wordstat&“x27”s“邻近规则”）,r,quanteda,R,Quanteda,在使用quanteda进行文本分析之前，我使用了Provalis Wordstat。当使用字典方法时，Wordstat允许用户在字典中包括常规术语和邻近规则（例如：“苏丹”不在“南部”；“刚果”不在“民主共和国”之后）。有没有可能在quanteda中应用类似的功能？朋友们建议通过正则表达式执行一些排除规则，但我不知道如何实现它虽然我不太熟悉编写正则表达式（或任何使之可行的选项），但我的想法是： # example for dictionary with names of 2 african c

在使用quanteda进行文本分析之前，我使用了Provalis Wordstat。当使用字典方法时，Wordstat允许用户在字典中包括常规术语和邻近规则（例如：“苏丹”不在“南部”；“刚果”不在“民主共和国”之后）。有没有可能在quanteda中应用类似的功能？朋友们建议通过正则表达式执行一些排除规则，但我不知道如何实现它

虽然我不太熟悉编写正则表达式（或任何使之可行的选项），但我的想法是：

# example for dictionary with names of 2 african countries
africa_dict <- dictionary(list(algeria="algeria",
                             republic_of_the_congo=c("republic_of_the_congo", "congo_(NOT AFTER democratic_republic_of_the_)")))

#包含两个非洲国家名称的词典示例
我知道这个问题。实施邻近规则并不容易，但我有一个想法。我知道这个问题，请加入我们的讨论。实施邻近规则并不容易，但我有一个想法。请加入我们的讨论