使用NLTK-python的Ngrams通用关联度量
nltk中有BigramAssocMeasures、TrigramAssocMeasures、QuadgramAssocMeasures、 但如果我有5gram或6gram,nltk中是否有5gramAssocMeasures或6gramAssocMeasures使用NLTK-python的Ngrams通用关联度量,python,python-2.7,python-3.x,nltk,n-gram,Python,Python 2.7,Python 3.x,Nltk,N Gram,nltk中有BigramAssocMeasures、TrigramAssocMeasures、QuadgramAssocMeasures、 但如果我有5gram或6gram,nltk中是否有5gramAssocMeasures或6gramAssocMeasures 有人能帮忙吗?你必须自己创建它们 查看关联模块的源代码。 您可以在/metrics/association.py下找到它(代表您的NLTK路径) 从 class QuingramAssocMeasures(NgramAssocMeas
有人能帮忙吗?你必须自己创建它们 查看
关联
模块的源代码。
您可以在/metrics/association.py
下找到它(
代表您的NLTK路径)
从
class QuingramAssocMeasures(NgramAssocMeasures):
"""
A collection of 5-gram association measures.
...
"""
或者随便你怎么称呼5克。
然后您需要定义特定于n-gram顺序的方法,即在抽象类中引发NotImplementedError
的方法:
。\u contraction()
和。\u marginals()
。
您可以查看3-gram和4-gram的实现,并通过类比构建方法。这将是一个巨大的局部变量,尽管…你必须自己创建它们 查看
关联
模块的源代码。
您可以在/metrics/association.py
下找到它(
代表您的NLTK路径)
从
class QuingramAssocMeasures(NgramAssocMeasures):
"""
A collection of 5-gram association measures.
...
"""
或者随便你怎么称呼5克。
然后您需要定义特定于n-gram顺序的方法,即在抽象类中引发NotImplementedError
的方法:
。\u contraction()
和。\u marginals()
。
您可以查看3-gram和4-gram的实现,并通过类比构建方法。这将是一个巨大的局部变量,尽管…看看它有什么不同。链接不是nltk特有的,但适用于任何通用列表。你可以用它来生成n-gram,一旦你有了nltk提供给你的单词列表,你可以通过继承
nltk.NgramAssocMeasures
@inspectorG4dget来自己创建它们。问题不是生成n-gram(这可以通过nltk.ngrams()
轻松实现),而是一个方便的“集合”{bi,tri,quad,}gram关联度量“。看看它有什么不同。该链接不是特定于nltk的,但适用于任何通用列表。你可以使用它生成n-gram,一旦你有了nltk提供的单词列表,你可以通过继承nltk来创建它们。NgramAssocMeasures
@inspectorG4dget问题不是生成n-gram(这可以通过nltk.ngrams()
轻松实现),但是关于方便的“收集{bi,tri,quad,}gram关联度量”.你的班级非常强大!!@gino如果答案帮助你解决了问题,请随意接受。你的班级非常强大!!@gino如果答案帮助你解决了问题,请随意接受。