Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/regex/17.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
使用标记regex根据存储在java文本文件中的单词分割评论_Java_Regex_Stanford Nlp - Fatal编程技术网

使用标记regex根据存储在java文本文件中的单词分割评论

使用标记regex根据存储在java文本文件中的单词分割评论,java,regex,stanford-nlp,Java,Regex,Stanford Nlp,我正在使用Stanford Pos tagger标记一些评论。但是,我需要将评论分成几个句子(已经完成)。对于我的方法来说,这是不够的,我还需要根据存储在外部文本文件(作为数据库)中的单词来拆分句子。例如,单词是产品功能或规格,如果一句话评论描述了两个不同的规格,我必须将其作为输出(输出文件)两个不同的行句子。每个规范都可以以#..开头。。。。 我需要的令牌正则表达式,可以帮助分裂的文字在一个文本文件 你能帮忙吗!感谢您请发布一些示例数据和您的尝试。首先感谢您的互动。首先感谢您的互动。关于数据示

我正在使用Stanford Pos tagger标记一些评论。但是,我需要将评论分成几个句子(已经完成)。对于我的方法来说,这是不够的,我还需要根据存储在外部文本文件(作为数据库)中的单词来拆分句子。例如,单词是产品功能或规格,如果一句话评论描述了两个不同的规格,我必须将其作为输出(输出文件)两个不同的行句子。每个规范都可以以#..开头。。。。 我需要的令牌正则表达式,可以帮助分裂的文字在一个文本文件


你能帮忙吗!感谢您

请发布一些示例数据和您的尝试。首先感谢您的互动。首先感谢您的互动。关于数据示例,我们可以以本iphone6 plus评论为例;“iphone6plus很容易放在我的前口袋里,当然不是那么紧的Levi's。”这只是一句话,我需要按产品功能(已经存储在一个文本文件中作为数据库)来划分它。我需要构建一些组合,比如如果有文本,然后是功能1,然后将文本与功能1联系起来,因为它可能包含关于它的意见等,我如何进行此类培训并构建这些组合…如果有四个单词,然后是一个功能,则将句子拆分并放入输出文件的新行中。。。。。。