Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/320.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
使用NLTK-python的Ngrams通用关联度量_Python_Python 2.7_Python 3.x_Nltk_N Gram - Fatal编程技术网

使用NLTK-python的Ngrams通用关联度量

使用NLTK-python的Ngrams通用关联度量,python,python-2.7,python-3.x,nltk,n-gram,Python,Python 2.7,Python 3.x,Nltk,N Gram,nltk中有BigramAssocMeasures、TrigramAssocMeasures、QuadgramAssocMeasures、 但如果我有5gram或6gram,nltk中是否有5gramAssocMeasures或6gramAssocMeasures 有人能帮忙吗?你必须自己创建它们 查看关联模块的源代码。 您可以在/metrics/association.py下找到它(代表您的NLTK路径) 从 class QuingramAssocMeasures(NgramAssocMeas

nltk中有BigramAssocMeasures、TrigramAssocMeasures、QuadgramAssocMeasures、

但如果我有5gram或6gram,nltk中是否有5gramAssocMeasures或6gramAssocMeasures


有人能帮忙吗?

你必须自己创建它们

查看
关联
模块的源代码。 您可以在
/metrics/association.py
下找到它(
代表您的NLTK路径)

class QuingramAssocMeasures(NgramAssocMeasures):
    """
    A collection of 5-gram association measures.
    ...
    """
或者随便你怎么称呼5克。 然后您需要定义特定于n-gram顺序的方法,即在抽象类中引发
NotImplementedError
的方法:
。\u contraction()
。\u marginals()

您可以查看3-gram和4-gram的实现,并通过类比构建方法。这将是一个巨大的局部变量,尽管…

你必须自己创建它们

查看
关联
模块的源代码。 您可以在
/metrics/association.py
下找到它(
代表您的NLTK路径)

class QuingramAssocMeasures(NgramAssocMeasures):
    """
    A collection of 5-gram association measures.
    ...
    """
或者随便你怎么称呼5克。 然后您需要定义特定于n-gram顺序的方法,即在抽象类中引发
NotImplementedError
的方法:
。\u contraction()
。\u marginals()

您可以查看3-gram和4-gram的实现,并通过类比构建方法。这将是一个巨大的局部变量,尽管…

看看它有什么不同。链接不是nltk特有的,但适用于任何通用列表。你可以用它来生成n-gram,一旦你有了nltk提供给你的单词列表,你可以通过继承
nltk.NgramAssocMeasures
@inspectorG4dget来自己创建它们。问题不是生成n-gram(这可以通过
nltk.ngrams()
轻松实现),而是一个方便的“集合”{bi,tri,quad,}gram关联度量“。看看它有什么不同。该链接不是特定于nltk的,但适用于任何通用列表。你可以使用它生成n-gram,一旦你有了nltk提供的单词列表,你可以通过继承
nltk来创建它们。NgramAssocMeasures
@inspectorG4dget问题不是生成n-gram(这可以通过
nltk.ngrams()
轻松实现),但是关于方便的“收集{bi,tri,quad,}gram关联度量”.你的班级非常强大!!@gino如果答案帮助你解决了问题,请随意接受。你的班级非常强大!!@gino如果答案帮助你解决了问题,请随意接受。