Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 使用朴素贝叶斯的文本微调器_Python_Python 2.7_Text_Spinner - Fatal编程技术网

Python 使用朴素贝叶斯的文本微调器

Python 使用朴素贝叶斯的文本微调器,python,python-2.7,text,spinner,Python,Python 2.7,Text,Spinner,我正在写一个文本微调器,它可以正常工作。但可读句子的准确性非常低,因为它只是使用我从数据库中获取的词典。哪种报税方式是这样的 {Your} {home| house| residence| property} {is} {your} {castle| mansion| fortress| palace} 并传递给函数,该函数根据用户的原始输入随机选择同义词并输出句子。例如,对于输入: Your home is your castle. 会回来的 Your property is your m

我正在写一个文本微调器,它可以正常工作。但可读句子的准确性非常低,因为它只是使用我从数据库中获取的词典。哪种报税方式是这样的

{Your} {home| house| residence| property} {is} {your} {castle| mansion| fortress| palace}
并传递给函数,该函数根据用户的原始输入随机选择同义词并输出句子。例如,对于输入:

Your home is your castle.
会回来的

Your property is your mansion.
现在我想加入人工智能,因为它将使我的输出句子更具可读性。我想知道如何使用朴素贝叶斯做出更好的选择。我知道我可能需要训练,以便取得更好的成绩

这是我目前选择单词的方法,现在非常简单

def spin(spintax):
    while True:
        word, n = re.subn('{([^{}]*)}',lambda m: random.choice(m.group(1).split("|")),spintax)
        if n == 0: break
return word.strip()

如果你们需要我发布更多代码,请提前感谢,让我知道这可能会结束,因为您的问题没有简明的答案,但您可能想查看nltk wordnet:


也许你可以下载谷歌从所有英文书籍中收集的数据集,并使用ngrams生成随机句子

实现是使用一个,其中下载的数据为您提供下一个单词的选择概率