Java “我该怎么做?”;划界;带文本文档的缓冲读取器?

Java “我该怎么做?”;划界;带文本文档的缓冲读取器?,java,text,delimiter,punctuation,buffered,Java,Text,Delimiter,Punctuation,Buffered,因此,我尝试使用缓冲读取器将文档(.txt)读入java项目,编辑它,然后返回/输出它。我遇到的问题是我无法识别标点符号。 文件内容如下: 你好,你好,你好/你好 作为对不同情况的测试,我希望能够应对。 我得到: 你好你好你好 有什么建议吗? (如果需要回答,将提供代码部分) 我曾考虑过使用分隔符,但不知道如何在上下文中使用分隔符(或者使用缓冲读取器是否可行) 顺便说一句,我正在逐字阅读和编辑此文档,并在多个数组中检查是否包含某些字符。如果有帮助。您可以通过循环将整个文件读入字符串(不建议用于大

因此,我尝试使用缓冲读取器将文档(.txt)读入java项目,编辑它,然后返回/输出它。我遇到的问题是我无法识别标点符号。 文件内容如下:

你好,你好,你好/你好

作为对不同情况的测试,我希望能够应对。 我得到:

你好你好你好

有什么建议吗? (如果需要回答,将提供代码部分) 我曾考虑过使用分隔符,但不知道如何在上下文中使用分隔符(或者使用缓冲读取器是否可行)


顺便说一句,我正在逐字阅读和编辑此文档,并在多个数组中检查是否包含某些字符。如果有帮助。

您可以通过循环将整个文件读入字符串(不建议用于大文件)

然后在字符串上:

String.split("[\s.,/]")
这将在几个不同的字符上拆分字符串

或者,如果要对所有非字母进行拆分:

String.split("[^A-Za-z]")

这将为您提供一个字符串数组,这非常容易使用。如果你想处理所有的标点符号和空格,我建议你选择lucene tokenizer完成这项工作。 这里给出了一个示例实现
但这取决于您的需求。如果只是逗号和空格,则正则表达式将执行所需的操作

,因此如果
hello hello.hello,hello/hello?
是您的输入,预期的输出是什么?我对你的措辞有点困惑。