Python 3.x 如何删除pythons中的POS标记并打印保留树的子树顺序

Python 3.x 如何删除pythons中的POS标记并打印保留树的子树顺序,python-3.x,nltk,Python 3.x,Nltk,我是python新手,需要以下方面的帮助。 我有一个字符串的格式: (S银色/RB(块42/CD英寸/NN)LED/NNP高清/NNP Nakamichi/NNP智能/NNP平板/NNP(块3D/CD电视/NN)) 我想要的输出: 银色、42英寸、LED、Nakamichi、智能、平板、3D电视 基本上,我希望在打印时将子树保留为单个字符串 请帮助首先,您应该只使用您自己尝试过的一些代码发布到SO,这样我们就可以看到您为解决自己的问题做出了任何努力。在你们展示的州里得到帮助只是人们的一种善意,但

我是python新手,需要以下方面的帮助。 我有一个字符串的格式:

(S银色/RB(块42/CD英寸/NN)LED/NNP高清/NNP Nakamichi/NNP智能/NNP平板/NNP(块3D/CD电视/NN))

我想要的输出: 银色、42英寸、LED、Nakamichi、智能、平板、3D电视

基本上,我希望在打印时将子树保留为单个字符串


请帮助

首先,您应该只使用您自己尝试过的一些代码发布到SO,这样我们就可以看到您为解决自己的问题做出了任何努力。在你们展示的州里得到帮助只是人们的一种善意,但你们的帖子可能会被否决

无论如何,您在这里显示的模式似乎不符合任何规则,例如,“Silver”部分将“/RB”字符串从中剥离,而输出中的“42 inch”元素不仅要剥离其他字符串,即“/CD”和“/NN”,而且还应作为一个字符串连接。除非你把逗号弄乱了,想要一个字符串(而不是一个列表,就像你所发布的那样),那么:

输出:

'Silver , 42 inch , LED , HD , Nakamichi , Smart , Flat , 3D TV'

尽管如此,这样做还是没有什么意义,因为字符串很短,而且里面没有规则模式(除非,正如我所说,你在展示你真正想要的东西时弄糟了)。

谢谢你回复Sqoshu。我提到的字符串基本上是一个有两个子树的树。您显示的输出是使用print(tree.leaves())获得的,但我想要的是以下格式:“银色,42英寸,LED,高清,Nakamichi,Smart,Flat,3D TV”这里我希望子树的叶子应该在一起。我还尝试使用这个模式=r'\w+:?(?=\/)和re.findall,但它给出的答案与您在检查编辑后给出的答案相同。请记住,这种方法只适用于这种情况,而不是所有你想使用它的人。非常感谢你的帮助。这个很好用。
'Silver , 42 inch , LED , HD , Nakamichi , Smart , Flat , 3D TV'