Python 名词化及其对应动词(德语)

Python 名词化及其对应动词(德语),python,dependencies,nltk,Python,Dependencies,Nltk,目前,我正在寻找一个ressource,它包含一个名词对应的动词(德语!)。例如:“Verständnis verstanden;Schaffen-Schaffen;Arbeit-arbeiten;…”。 是否已经存在一个现有的ressource,或者如何构建这样一个文件 因为我没有找到任何这样的资源,所以我尝试编写自己的代码来提取“名词对应动词”列表。我所做的:我拿了一篇课文,寻找大写的单词。之后,我寻找带有附加结尾“en”的小写单词,如果它们在文本中,我会得到一对新的“名词-动词”。但正如您

目前,我正在寻找一个ressource,它包含一个名词对应的动词(德语!)。例如:“Verständnis verstanden;Schaffen-Schaffen;Arbeit-arbeiten;…”。 是否已经存在一个现有的ressource,或者如何构建这样一个文件

因为我没有找到任何这样的资源,所以我尝试编写自己的代码来提取“名词对应动词”列表。我所做的:我拿了一篇课文,寻找大写的单词。之后,我寻找带有附加结尾“en”的小写单词,如果它们在文本中,我会得到一对新的“名词-动词”。但正如您在我的示例中看到的,我无法提取“Verständnis verstanden”等等……因此这不是一个好的解决方案:(

所以我的问题是:如果还没有这样的资源,你将如何提取这些对应关系?我确信我应该使用一些nltk模块,用于柠檬化等等


无论如何:谢谢你的帮助!

我不知道这样的资源是否在任何地方都可用。但可能有助于你搜索的是你正在寻找的东西的名称:它被称为派生关系。引理化是一个可能有助于你的步骤(例如,找出“Verständnis”是从动词“verstehen”派生出来的,而不是“verstanden”,这是过去分词),但它不会在POS中为您提供所需的匹配。有一些形态分析器可以执行这些类型的派生,甚至可以(以不同的成功率)对未知单词执行派生。它们是复杂的野兽,例如使用“有限状态传感器”除非你能找到一个适合德语的现成词条,否则你可能会被字典的方法所困扰。