Python 2.7 用于拼写更正的双字符搭配,Python

Python 2.7 用于拼写更正的双字符搭配,Python,python-2.7,replace,nltk,spell-checking,n-gram,Python 2.7,Replace,Nltk,Spell Checking,N Gram,我正在基于peter norvig的代码构建拼写更正算法。添加我自己的案例可以提高效率(因为我没有像big.txt这样的参考文本,文本大部分由非英语单词组成)。 我注意到单词“golden”被自动更正为“garden”(因为garden在文本中出现的频率更高)。所以我决定在文本中添加二元搭配。这将允许golden在与通常出现的某个单词组合时保持金色。我正在实施它,我需要一些帮助。下面是一段代码: import nltk from nltk.collocations import * bigram

我正在基于peter norvig的代码构建拼写更正算法。添加我自己的案例可以提高效率(因为我没有像big.txt这样的参考文本,文本大部分由非英语单词组成)。
我注意到单词“golden”被自动更正为“garden”(因为garden在文本中出现的频率更高)。所以我决定在文本中添加二元搭配。这将允许golden在与通常出现的某个单词组合时保持金色。我正在实施它,我需要一些帮助。下面是一段代码:

import nltk
from nltk.collocations import *
bigram_measures = nltk.collocations.BigramAssocMeasures()
finder = BigramCollocationFinder.from_words(tokenized) #create bigram pairs in text called tokenized
finder.apply_freq_filter(3) #bigrams which occur less than 3 times will not be considered. 
接下来我要做的是添加一个例外,如果它出现在“finder”中,那么这个词就不应该被替换。我如何使用它?
(如果问题陈述不太清楚,我会根据要求进行编辑)