Java 创建单词';流式扫描仪
需要从文件中返回包含3个字母及更多字母的所有单词的流。有没有比下面更好的方法,可能是使用Stream.iterate:Java 创建单词';流式扫描仪,java,loops,java-stream,builder,word,Java,Loops,Java Stream,Builder,Word,需要从文件中返回包含3个字母及更多字母的所有单词的流。有没有比下面更好的方法,可能是使用Stream.iterate: private Stream<String> getWordsStream(String path){ Stream.Builder<String> wordsStream = Stream.builder(); FileInputStream inputStream = null; try { inputStre
private Stream<String> getWordsStream(String path){
Stream.Builder<String> wordsStream = Stream.builder();
FileInputStream inputStream = null;
try {
inputStream = new FileInputStream(path);
} catch (FileNotFoundException e) {
e.printStackTrace();
}
Scanner s = new Scanner(inputStream);
s.useDelimiter("([^a-zA-Z])");
Pattern pattern = Pattern.compile("([a-zA-Z]{3,})");
while ((s.hasNext())){
if(s.hasNext(pattern)){
wordsStream.add(s.next().toUpperCase());
}
else {
s.next();
}
}
s.close();
return wordsStream.build();
}
私有流getWordsStream(字符串路径){
Stream.Builder wordsStream=Stream.Builder();
FileInputStream inputStream=null;
试一试{
inputStream=新文件inputStream(路径);
}catch(filenotfounde异常){
e、 printStackTrace();
}
扫描仪s=新扫描仪(inputStream);
s、 使用分隔符(([^a-zA-Z]);
Pattern=Pattern.compile(([a-zA-Z]{3,})”;
而((s.hasNext())){
如果(s.hasNext(模式)){
添加(s.next().toUpperCase());
}
否则{
s、 next();
}
}
s、 close();
返回wordsStream.build();
}
方法简单得多:从文件读取行到流
,并使用所需条件(例如长度>=3)对其进行过滤Files.lines()
具有延迟加载,因此它不会在开始时准备好文件中的所有单词,而是在每次需要下一个单词时都这样做
public static void main(String... args) throws IOException {
getWordsStream(Paths.get("d:/words.txt")).forEach(System.out::println);
}
public static Stream<String> getWordsStream(Path path) throws IOException {
final Scanner scan = new Scanner(path);
return StreamSupport.stream(new Spliterators.AbstractSpliterator<String>(Long.MAX_VALUE,
Spliterator.DISTINCT | Spliterator.IMMUTABLE | Spliterator.NONNULL | Spliterator.ORDERED) {
@Override
public boolean tryAdvance(Consumer<? super String> action) {
while (scan.hasNext()) {
String word = scan.next();
// you can use RegExp if you have more complicated condition
if (word.length() < 3)
continue;
action.accept(word);
return true;
}
return false;
}
}, false).onClose(scan::close);
}
publicstaticvoidmain(String…args)抛出IOException{
getWordsStream(path.get(“d:/words.txt”)).forEach(System.out::println);
}
公共静态流getWordsStream(路径路径)引发IOException{
最终扫描仪扫描=新扫描仪(路径);
返回StreamSupport.stream(新的拆分器.AbstractSpliterator(Long.MAX_值,
Spliterator.DISTINCT | Spliterator.IMMUTABLE | Spliterator.NONNULL | Spliterator.ORDERED){
@凌驾
public boolean tryAdvance(ConsumerThre’s更简单的方法:从文件到流中读取行,并使用所需条件(例如长度>=3)对其进行过滤。Files.lines()
具有延迟加载,因此它不会在开始时准备好文件中的所有字,每次需要下一个字时都会这样做
public static void main(String... args) throws IOException {
getWordsStream(Paths.get("d:/words.txt")).forEach(System.out::println);
}
public static Stream<String> getWordsStream(Path path) throws IOException {
final Scanner scan = new Scanner(path);
return StreamSupport.stream(new Spliterators.AbstractSpliterator<String>(Long.MAX_VALUE,
Spliterator.DISTINCT | Spliterator.IMMUTABLE | Spliterator.NONNULL | Spliterator.ORDERED) {
@Override
public boolean tryAdvance(Consumer<? super String> action) {
while (scan.hasNext()) {
String word = scan.next();
// you can use RegExp if you have more complicated condition
if (word.length() < 3)
continue;
action.accept(word);
return true;
}
return false;
}
}, false).onClose(scan::close);
}
publicstaticvoidmain(String…args)抛出IOException{
getWordsStream(path.get(“d:/words.txt”)).forEach(System.out::println);
}
公共静态流getWordsStream(路径路径)引发IOException{
最终扫描仪扫描=新扫描仪(路径);
返回StreamSupport.stream(新的拆分器.AbstractSpliterator(Long.MAX_值,
Spliterator.DISTINCT | Spliterator.IMMUTABLE | Spliterator.NONNULL | Spliterator.ORDERED){
@凌驾
public boolean tryAdvance(Consumer您可以使用Files.lines()
和模式
:
private static final Pattern SPACES = Pattern.compile("[^a-zA-Z]+");
public static Stream<String> getWordStream(String path) throws IOException{
return Files.lines(Paths.get(path))
.flatMap(SPACES::splitAsStream)
.filter(word -> word.length() >= 3);
}
private static final Pattern SPACES=Pattern.compile(“[^a-zA-Z]+”);
公共静态流getWordStream(字符串路径)引发IOException{
返回文件.line(路径.get(路径))
.flatMap(空格::拆分流)
.filter(word->word.length()>=3);
}
您可以使用文件.lines()
和模式
:
private static final Pattern SPACES = Pattern.compile("[^a-zA-Z]+");
public static Stream<String> getWordStream(String path) throws IOException{
return Files.lines(Paths.get(path))
.flatMap(SPACES::splitAsStream)
.filter(word -> word.length() >= 3);
}
private static final Pattern SPACES=Pattern.compile(“[^a-zA-Z]+”);
公共静态流getWordStream(字符串路径)引发IOException{
返回文件.line(路径.get(路径))
.flatMap(空格::拆分流)
.filter(word->word.length()>=3);
}
代码中最糟糕的部分是以下部分
FileInputStream inputStream = null;
try {
inputStream = new FileInputStream(path);
} catch (FileNotFoundException e) {
e.printStackTrace();
}
Scanner s = new Scanner(inputStream);
因此,当文件不存在时,您将打印FileNotFoundException
堆栈跟踪,并继续执行null
输入流,导致NullPointerException
。与要求调用方处理虚假的NullPointerException
不同,您应该在t中声明FileNotFoundException
方法签名。否则,在错误的情况下返回空流
但是您根本不需要构造FileInputStream
,因为Scanner
为构造函数提供了接受文件
或路径
的功能。将此功能与返回匹配流的功能结合起来(自Java 9以来),您可以得到:
private Stream<String> getWordsStream(String path) {
try {
Scanner s = new Scanner(Paths.get(path));
return s.findAll("([a-zA-Z]{3,})").map(mr -> mr.group().toUpperCase());
} catch(IOException ex) {
Logger.getLogger(Main.class.getName()).log(Level.SEVERE, null, ex);
return Stream.empty();
}
}
代码中最糟糕的部分是以下部分
FileInputStream inputStream = null;
try {
inputStream = new FileInputStream(path);
} catch (FileNotFoundException e) {
e.printStackTrace();
}
Scanner s = new Scanner(inputStream);
因此,当文件不存在时,您将打印FileNotFoundException
堆栈跟踪,并继续执行null
输入流,导致NullPointerException
。与要求调用方处理虚假的NullPointerException
不同,您应该在t中声明FileNotFoundException
方法签名。否则,在错误的情况下返回空流
但是您根本不需要构造FileInputStream
,因为Scanner
为构造函数提供了接受文件
或路径
的功能。将此功能与返回匹配流的功能结合起来(自Java 9以来),您可以得到:
private Stream<String> getWordsStream(String path) {
try {
Scanner s = new Scanner(Paths.get(path));
return s.findAll("([a-zA-Z]{3,})").map(mr -> mr.group().toUpperCase());
} catch(IOException ex) {
Logger.getLogger(Main.class.getName()).log(Level.SEVERE, null, ex);
return Stream.empty();
}
}
哪个Java版本?您是想调用s.next(pattern)
?可能将整个流作为字符串读取,然后用空格(或您正在使用的任何内容)将其拆分Java 9.我的意思是:有没有可能编写更接近流样式的方法,而不使用while循环,哪一个Java版本?你的意思是调用s.next(pattern)
?可能将整个流读取为字符串,然后用空格(或任何你正在使用的)将其拆分Java 9。我的意思是:有没有可能编写更接近流样式的方法,而不在allandlines()处执行while循环
将返回一个字流?对于这种方法来说,这是一个非常糟糕的名称-可能是Java 9,但可以肯定的是,在Java 11中,它返回的是一个行流。它返回的行在任何Java中都超过3个字母符号。我有一个未准备好的文本。因此需要再次循环以查找行中的所有匹配项。实际上,行()
返回所有行,不仅仅是包含3个以上字母的行。返回包含3个或更多字母的行的是getWordsStream()
。但问题是包含3个或更多字母的单词,而不是包含3个或更多字母的行,您不需要更改该方法的签名,可以使用Files.lines(Path.of(Path))
代替.Fixed.Sa