Nlp 在哪里可以找到英语短语列表?

Nlp 在哪里可以找到英语短语列表?,nlp,linguistics,Nlp,Linguistics,我的任务是搜索文本中的陈词滥调和常用短语。这些短语与你可能看到的“命运之轮上的字谜”中的短语相似。以下是几个例子: 来得容易去得快 好得难以置信 胜利不是一切 但是,我找不到短语列表。有人知道这样的名单吗 说真的,即使是一个全方位的财富解决方案列表也足够了。下面是一个巨大的列表(a-K),下一页的L-Z: 此外,Wikiquote为您提供了一系列: 如果你想要一个陈词滥调的列表,请不要再看了: 这两个站点都有您提到的三个站点: 1) 你应该能够很容易地从中获得一个列表。有一个2100个习

我的任务是搜索文本中的陈词滥调和常用短语。这些短语与你可能看到的“命运之轮上的字谜”中的短语相似。以下是几个例子:

  • 来得容易去得快
  • 好得难以置信
  • 胜利不是一切
但是,我找不到短语列表。有人知道这样的名单吗


说真的,即使是一个全方位的财富解决方案列表也足够了。

下面是一个巨大的列表(a-K),下一页的L-Z:

此外,Wikiquote为您提供了一系列:

如果你想要一个陈词滥调的列表,请不要再看了:

这两个站点都有您提到的三个站点:


1)

你应该能够很容易地从中获得一个列表。

有一个2100个习惯用法的列表。列表看起来很容易获取。

如果要自动生成列表:


抓取twitter和尽可能多的博客,因为你可以获得RSS提要。使用它们为马尔可夫链构建一个语料库,并寻找概率极高的解析。我怀疑陈词滥调在一开始会很正常,但在接近尾声时会有异常低的熵。也就是说,一旦你看到“X Y Z”,你几乎可以肯定地说,接下来的单词将是“A B C”。

我知道答案已经被接受了。。。但答案是过时的。目前,wiktionary是最好的去处(~8000个条目):

感谢您迄今为止的答案,但我需要更全面的内容。作为一个测试,它应该包含我的三个示例。谢谢你教我怎么做fish@thepandaatemyface几乎忽略了一个事实,那就是这是一个常见的短语(是按照网络钓鱼的思路思考的,这也适用于双关语?)5个链接中的3个现在已经死了。@JorisGroosman是的,但我更正了3个死链接中的2个,并删除了第3个