Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/363.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
在python NLTK中,我希望得到非空白字符串的形态分析结果_Python_Nltk_Morphological Analysis - Fatal编程技术网

在python NLTK中,我希望得到非空白字符串的形态分析结果

在python NLTK中,我希望得到非空白字符串的形态分析结果,python,nltk,morphological-analysis,Python,Nltk,Morphological Analysis,我想从NLTK得到一个非WhiteAPCE字符串的形态学分析结果 例如: 字符串是“societynamebank” 我想获得['society','name','bank'] 如何在NLTK上获得该结果?下面是一个简单的代码,可以帮助您。它使用pyEnchant字典进行形态分析: >>> import enchant >>> d = enchant.Dict("en_US") >>> tokens=[] >>> def t

我想从NLTK得到一个非WhiteAPCE字符串的形态学分析结果

例如:

字符串是“societynamebank”

我想获得
['society','name','bank']


如何在NLTK上获得该结果?

下面是一个简单的代码,可以帮助您。它使用pyEnchant字典进行形态分析:

>>> import enchant
>>> d = enchant.Dict("en_US")
>>> tokens=[]
>>> def tokenize(st):
...    if not st:return
...    for i in xrange(len(st),-1,-1):
...       if d.check(st[0:i]):
...          tokens.append(st[0:i])
...          st=st[i:]
...          tokenize(st)
...          break
... 
>>> tokenize("societynamebank")
>>> tokens
['society', 'name', 'bank']
>>> tokens=[]
>>> tokenize("HelloSirthereissomethingwrongwiththistext")
>>> tokens
['Hello', 'Sir', 'there', 'is', 'something', 'wrong', 'with', 'this', 'text']

下面是一个简单的代码,可以帮助您。它使用pyEnchant字典进行形态分析:

>>> import enchant
>>> d = enchant.Dict("en_US")
>>> tokens=[]
>>> def tokenize(st):
...    if not st:return
...    for i in xrange(len(st),-1,-1):
...       if d.check(st[0:i]):
...          tokens.append(st[0:i])
...          st=st[i:]
...          tokenize(st)
...          break
... 
>>> tokenize("societynamebank")
>>> tokens
['society', 'name', 'bank']
>>> tokens=[]
>>> tokenize("HelloSirthereissomethingwrongwiththistext")
>>> tokens
['Hello', 'Sir', 'there', 'is', 'something', 'wrong', 'with', 'this', 'text']

下面是一个简单的代码,可以帮助您。它使用pyEnchant字典进行形态分析:

>>> import enchant
>>> d = enchant.Dict("en_US")
>>> tokens=[]
>>> def tokenize(st):
...    if not st:return
...    for i in xrange(len(st),-1,-1):
...       if d.check(st[0:i]):
...          tokens.append(st[0:i])
...          st=st[i:]
...          tokenize(st)
...          break
... 
>>> tokenize("societynamebank")
>>> tokens
['society', 'name', 'bank']
>>> tokens=[]
>>> tokenize("HelloSirthereissomethingwrongwiththistext")
>>> tokens
['Hello', 'Sir', 'there', 'is', 'something', 'wrong', 'with', 'this', 'text']

下面是一个简单的代码,可以帮助您。它使用pyEnchant字典进行形态分析:

>>> import enchant
>>> d = enchant.Dict("en_US")
>>> tokens=[]
>>> def tokenize(st):
...    if not st:return
...    for i in xrange(len(st),-1,-1):
...       if d.check(st[0:i]):
...          tokens.append(st[0:i])
...          st=st[i:]
...          tokenize(st)
...          break
... 
>>> tokenize("societynamebank")
>>> tokens
['society', 'name', 'bank']
>>> tokens=[]
>>> tokenize("HelloSirthereissomethingwrongwiththistext")
>>> tokens
['Hello', 'Sir', 'there', 'is', 'something', 'wrong', 'with', 'this', 'text']

NLTK
中没有此类模块。你是在学习英语还是德语?英语测试。我在url下使用。我希望语素分析器可以分割这个字符串。
NLTK
中没有这样的模块。你是在学习英语还是德语?英语测试。我在url下使用。我希望语素分析器可以分割这个字符串。
NLTK
中没有这样的模块。你是在学习英语还是德语?英语测试。我在url下使用。我希望语素分析器可以分割这个字符串。
NLTK
中没有这样的模块。你是在学习英语还是德语?英语测试。我在url下使用。我希望语素分析器可以分割这个字符串。