Nlp 从单词中组合语法正确短语的算法

Nlp 从单词中组合语法正确短语的算法,nlp,algorithm,Nlp,Algorithm,我目前面临的问题如下。我有一组单词,如果可能的话,我想用它们构造一个语法正确的短语/句子。到目前为止,我尝试的是: 从参考文本语料库计算每个单词在句子中的平均位置 使用此选项,将单词按集合排序,并用空格分隔 这种方法的问题在于,大多数时候它会产生毫无意义的奇怪短语。有没有办法做到这一点,也许可以使用一些技巧(假设我只学英语)?你可以看看这个马尔可夫链的例子:如果你只有一袋单词,我想你需要 查找每个单词的所有可能标记 以语法/语法有效的方式组合它们 然而,这并不一定能给你提供有意义的句子。它们

我目前面临的问题如下。我有一组单词,如果可能的话,我想用它们构造一个语法正确的短语/句子。到目前为止,我尝试的是:

  • 从参考文本语料库计算每个单词在句子中的平均位置
  • 使用此选项,将单词按集合排序,并用空格分隔

这种方法的问题在于,大多数时候它会产生毫无意义的奇怪短语。有没有办法做到这一点,也许可以使用一些技巧(假设我只学英语)?

你可以看看这个马尔可夫链的例子:

如果你只有一袋单词,我想你需要

  • 查找每个单词的所有可能标记
  • 以语法/语法有效的方式组合它们
  • 然而,这并不一定能给你提供有意义的句子。它们很可能会很奇怪,尽管如果你的话太拘束的话可能不会,就像看起来的那样


    如果你有一个语料库(我第一次读你的问题时就错过了),那么你应该将它与类似的东西一起使用,它使用n-gram生成文本。

    你可以使用ngram模型生成文本。 也许这有帮助:


    一种常见的方法是从语料库中获取所有3克,然后使用概率生成文本。

    你是有一袋单词还是一个文本来生成更多文本?还有,你所说的有意义或毫无意义的短语是什么意思?看一看,它涉及到使用Python的NLTK的n-grams从源/种子文本生成文本。(在学术层面上处理这个问题)你只想要语法正确的短语吗?“无色绿色想法疯狂睡眠”是一个有意义的句子吗?@amp我有很多单词,希望从每个袋子中生成语法正确的短语,最好使用袋子中的所有单词,袋子的大小小于10个单词。谢谢你的链接,我来看看。@Kevin是的,语法正确的短语就足够了。“无色绿色想法疯狂睡眠”会很好。