Python 2.7 用于拼写更正的双字符搭配，Python_Python 2.7_Replace_Nltk_Spell Checking_N Gram

Python 2.7 用于拼写更正的双字符搭配，Python

python-2.7 replace

Python 2.7 用于拼写更正的双字符搭配，Python,python-2.7,replace,nltk,spell-checking,n-gram,Python 2.7,Replace,Nltk,Spell Checking,N Gram,我正在基于peter norvig的代码构建拼写更正算法。添加我自己的案例可以提高效率（因为我没有像big.txt这样的参考文本，文本大部分由非英语单词组成）。我注意到单词“golden”被自动更正为“garden”（因为garden在文本中出现的频率更高）。所以我决定在文本中添加二元搭配。这将允许golden在与通常出现的某个单词组合时保持金色。我正在实施它，我需要一些帮助。下面是一段代码： import nltk from nltk.collocations import * bigram

我正在基于peter norvig的代码构建拼写更正算法。添加我自己的案例可以提高效率（因为我没有像big.txt这样的参考文本，文本大部分由非英语单词组成）。
我注意到单词“golden”被自动更正为“garden”（因为garden在文本中出现的频率更高）。所以我决定在文本中添加二元搭配。这将允许golden在与通常出现的某个单词组合时保持金色。我正在实施它，我需要一些帮助。下面是一段代码：

import nltk
from nltk.collocations import *
bigram_measures = nltk.collocations.BigramAssocMeasures()
finder = BigramCollocationFinder.from_words(tokenized) #create bigram pairs in text called tokenized
finder.apply_freq_filter(3) #bigrams which occur less than 3 times will not be considered.

接下来我要做的是添加一个例外，如果它出现在“finder”中，那么这个词就不应该被替换。我如何使用它？
（如果问题陈述不太清楚，我会根据要求进行编辑）