Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/ruby-on-rails/63.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Ruby on rails NLP和Ruby用于描述书写质量_Ruby On Rails_Ruby_Nlp_Machine Learning - Fatal编程技术网

Ruby on rails NLP和Ruby用于描述书写质量

Ruby on rails NLP和Ruby用于描述书写质量,ruby-on-rails,ruby,nlp,machine-learning,Ruby On Rails,Ruby,Nlp,Machine Learning,我想尝试在我的应用程序中将传入的文档描述为“写得好”或“写得差”。我意识到这不是一项容易的任务,但即使是一个粗略的想法也会有用。我觉得这样做的方法是通过两个类的朴素贝叶斯分类器,但我愿意接受建议。所以有两个问题: 考虑到简单性,这种方法是实现这一点的最佳方法吗 假设训练数据库足够大 ruby中有库吗 (或任何可集成JRuby或 无论什么)我可以插入我的 rails应用程序可以轻松实现这一点吗 谢谢 您可以尝试使用词汇向量分析。这里介绍了一些: 基本上,你建立一个你认为“写得好”或“写得差”的文

我想尝试在我的应用程序中将传入的文档描述为“写得好”或“写得差”。我意识到这不是一项容易的任务,但即使是一个粗略的想法也会有用。我觉得这样做的方法是通过两个类的朴素贝叶斯分类器,但我愿意接受建议。所以有两个问题:

  • 考虑到简单性,这种方法是实现这一点的最佳方法吗 假设训练数据库足够大

  • ruby中有库吗 (或任何可集成JRuby或 无论什么)我可以插入我的 rails应用程序可以轻松实现这一点吗


  • 谢谢

    您可以尝试使用词汇向量分析。这里介绍了一些:

    基本上,你建立一个你认为“写得好”或“写得差”的文本语料库,并计算某些单词的频率。为每个文档生成一个规范化向量,然后计算这些向量与每个传入文档的向量之间的距离。我不是统计学家,但有人告诉我这类似于贝叶斯过滤,但似乎能更好地处理拼写错误和异常值


    无论如何,这并不完美。取决于你需要它的准确性,你可能仍然需要人类来做出最终的判断。但我们很幸运地将其用作预筛选,以减少评论者的数量。

    您可能会发现,这是一个非常有趣的非常高层次的概述,介绍了一个特定系统如何进行论文评估以及风格更正。

    另一个简单的检查算法是可读性度量。它的应用相当广泛,应该很容易实现。我假设其中一个有音节方法。

    Ken-您是否使用特定的库来完成此任务?或者只是手工编码?看起来是个好的开始。