Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/algorithm/11.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Algorithm 使用NLP自动清理用户生成的内容?_Algorithm_Language Agnostic_Nlp_Semantics - Fatal编程技术网

Algorithm 使用NLP自动清理用户生成的内容?

Algorithm 使用NLP自动清理用户生成的内容?,algorithm,language-agnostic,nlp,semantics,Algorithm,Language Agnostic,Nlp,Semantics,是否可以使用NLP自动改进用户生成的内容 目标是用一句糟糕的UGC句子,如: 没有近光灯或行车灯。灯泡正常,远光灯工作 并尝试将其改进为: 没有运行灯或近光灯。灯泡正常,远光灯正常工作 任何建议都将不胜感激。这是可能的 首先,您必须解析句子并提取词性标记。为此,我推荐斯坦福解析器,但我鼓励您寻找替代方案 为了更好地理解我的答案,请在斯坦福解析器的在线版本中键入第一句话: 转到已处理的依赖项并查看依赖项树 本质上,您需要做的是在依赖关系树中找到一个模式,然后相应地修改它。例如,在这种情况下,你必须

是否可以使用NLP自动改进用户生成的内容

目标是用一句糟糕的UGC句子,如:

没有近光灯或行车灯。灯泡正常,远光灯工作

并尝试将其改进为:

没有运行灯或近光灯。灯泡正常,远光灯正常工作

任何建议都将不胜感激。

这是可能的

首先,您必须解析句子并提取词性标记。为此,我推荐斯坦福解析器,但我鼓励您寻找替代方案

为了更好地理解我的答案,请在斯坦福解析器的在线版本中键入第一句话:

转到已处理的依赖项并查看依赖项树


本质上,您需要做的是在依赖关系树中找到一个模式,然后相应地修改它。例如,在这种情况下,你必须找到ok这是一个开放的研究问题。人们意识到,在分析推特、youtube评论等时,规范化非常有用

在研究层面上,我发现了第一篇文章:

在检查他们的参考资料时,还有以下内容:。他们似乎从机器翻译的角度来看待这个问题——将用户生成的内容翻译成正确的英语

在更实际的层面上,我没有尝试过很多东西,我一直使用的是。他们有一个标准化算法,但我认为它非常简单——只是用我不知道的代码替换像idk这样的东西