从Python集中提取数据

从Python集中提取数据,python,nltk,Python,Nltk,我有一套python: >>> print (x) [(0, Synset('basic.n.01'), Synset('cry.v.02')), (3, Synset('base.n.01'), Synset('help.v.04'))] 我想将其解析为列表或字典,如下所示: {"value": 0, "keyword1": "basic", "keyword2": "cry"} {"value": 3, "keyword1": "base", "keyword2

我有一套python:

>>> print (x)
[(0, Synset('basic.n.01'), Synset('cry.v.02')), 
 (3, Synset('base.n.01'), Synset('help.v.04'))]
我想将其解析为列表或字典,如下所示:

{"value": 0, "keyword1": "basic",  "keyword2": "cry"} 
{"value": 3, "keyword1": "base",  "keyword2": "help"}

您可以将数据结构转换为字典,但需要一个辅助功能:

def prepare(item):
    return item[0],item[1].lemma_names()[0], item[2].lemma_names()[0]

keys = "value", "keyword1", "keyword2"
[dict(zip(keys, prepare(item))) for item in x]

第二本词典中的第三个词条来自哪里?它与输入数据的关系如何?为什么选择'base'作为Synset('base.n.01')的引理,选择'cry'作为Synset('cry.v.02')?他们也有其他引理。@DYZ这是一个错误,编辑了问题“笑”来自哪里?如何为每个语法集选择引理名称?是的,我只想要第一个