Ruby on rails NLP和Ruby用于描述书写质量
我想尝试在我的应用程序中将传入的文档描述为“写得好”或“写得差”。我意识到这不是一项容易的任务,但即使是一个粗略的想法也会有用。我觉得这样做的方法是通过两个类的朴素贝叶斯分类器,但我愿意接受建议。所以有两个问题:Ruby on rails NLP和Ruby用于描述书写质量,ruby-on-rails,ruby,nlp,machine-learning,Ruby On Rails,Ruby,Nlp,Machine Learning,我想尝试在我的应用程序中将传入的文档描述为“写得好”或“写得差”。我意识到这不是一项容易的任务,但即使是一个粗略的想法也会有用。我觉得这样做的方法是通过两个类的朴素贝叶斯分类器,但我愿意接受建议。所以有两个问题: 考虑到简单性,这种方法是实现这一点的最佳方法吗 假设训练数据库足够大 ruby中有库吗 (或任何可集成JRuby或 无论什么)我可以插入我的 rails应用程序可以轻松实现这一点吗 谢谢 您可以尝试使用词汇向量分析。这里介绍了一些: 基本上,你建立一个你认为“写得好”或“写得差”的文
谢谢 您可以尝试使用词汇向量分析。这里介绍了一些: 基本上,你建立一个你认为“写得好”或“写得差”的文本语料库,并计算某些单词的频率。为每个文档生成一个规范化向量,然后计算这些向量与每个传入文档的向量之间的距离。我不是统计学家,但有人告诉我这类似于贝叶斯过滤,但似乎能更好地处理拼写错误和异常值
无论如何,这并不完美。取决于你需要它的准确性,你可能仍然需要人类来做出最终的判断。但我们很幸运地将其用作预筛选,以减少评论者的数量。您可能会发现,这是一个非常有趣的非常高层次的概述,介绍了一个特定系统如何进行论文评估以及风格更正。另一个简单的检查算法是可读性度量。它的应用相当广泛,应该很容易实现。我假设其中一个有音节方法。Ken-您是否使用特定的库来完成此任务?或者只是手工编码?看起来是个好的开始。