从Python集中提取数据_Python_Nltk

从Python集中提取数据

python

从Python集中提取数据,python,nltk,Python,Nltk,我有一套python： >>> print (x) [(0, Synset('basic.n.01'), Synset('cry.v.02')), (3, Synset('base.n.01'), Synset('help.v.04'))] 我想将其解析为列表或字典，如下所示： {"value": 0, "keyword1": "basic", "keyword2": "cry"} {"value": 3, "keyword1": "base", "keyword2

我有一套python：

>>> print (x)
[(0, Synset('basic.n.01'), Synset('cry.v.02')), 
 (3, Synset('base.n.01'), Synset('help.v.04'))]

我想将其解析为列表或字典，如下所示：

{"value": 0, "keyword1": "basic",  "keyword2": "cry"} 
{"value": 3, "keyword1": "base",  "keyword2": "help"}

您可以将数据结构转换为字典，但需要一个辅助功能：

def prepare(item):
    return item[0],item[1].lemma_names()[0], item[2].lemma_names()[0]

keys = "value", "keyword1", "keyword2"
[dict(zip(keys, prepare(item))) for item in x]

第二本词典中的第三个词条来自哪里？它与输入数据的关系如何？为什么选择'base'作为Synset（'base.n.01'）的引理，选择'cry'作为Synset（'cry.v.02'）？他们也有其他引理。@DYZ这是一个错误，编辑了问题“笑”来自哪里？如何为每个语法集选择引理名称？是的，我只想要第一个