HTML文件上的Java扫描程序中途停止
我正在编写一个小脚本,根据本地保存的网页()填充一些数据 剧本:HTML文件上的Java扫描程序中途停止,java,java.util.scanner,Java,Java.util.scanner,我正在编写一个小脚本,根据本地保存的网页()填充一些数据 剧本: public static void main(String [] args) throws FileNotFoundException{ File file = new File("C:\\Users\\Jester\\Desktop\\data scrap payday\\Achievements_(Payday_2).htm"); int count = 0; int words = 0;
public static void main(String [] args) throws FileNotFoundException{
File file = new File("C:\\Users\\Jester\\Desktop\\data scrap payday\\Achievements_(Payday_2).htm");
int count = 0;
int words = 0;
Scanner scanner = new Scanner(file);
while (scanner.hasNext()) {
String nextToken = scanner.next();
if (nextToken.contains("unlock")||nextToken.contains("Unlock")){
count++;
}
words++;
System.out.println(nextToken);
}
scanner.close();
System.out.println(count);
System.out.println(words);
}
但是,while循环在该行结束
<td style="vertical-align: top; width: 64px"> <a href="http://vignette3.wikia.nocookie.net/payday/images/d/db/From_Russia_With_Love.jpg/revision/latest?cb=20131103145029" class="image image-thumbnail" ><img src="data:image/gif;base64,R0lGODlhAQABAIABAAAAAP///yH5BAEAAAEALAAAAAABAAEAQAICTAEAOw%3D%3D" alt="From Russia With Love" class="lzy lzyPlcHld " data-image-key="From_Russia_With_Love.jpg" data-image-name="From Russia With Love.jpg" data-src="http://vignette3.wikia.nocookie.net/payday/images/d/db/From_Russia_With_Love.jpg/revision/latest?cb=20131103145029" width="64" height="64" onload="if(typeof ImgLzy==='object'){ImgLzy.load(this)}" ><noscript><img src="http://vignette3.wikia.nocookie.net/payday/images/d/db/From_Russia_With_Love.jpg/revision/latest?cb=20131103145029" alt="From Russia With Love" class="" data-image-key="From_Russia_With_Love.jpg" data-image-name="From Russia With Love.jpg" width="64" height="64" ></noscript></a>
(也不知道为什么它会把一半的单词删掉,因为里面没有空格)
如果我删除这一行,整个html中似乎有各种各样的行适合while循环的结束条件,但我似乎不知道该模式可能是什么
关于scanner.hasNext()在这些问题上返回false的原因,您有什么想法吗?这里有一些想法,您使用哪个浏览器来保存文件?使用Firefox保存的页面,您的代码在我的机器上运行良好。Chrome,我将尝试使用Firefox保存它。谢谢没有这样的运气,在使用Firefox之前,不幸的是在对象上结束:(你能试试
Scanner=newscanner(文件,“UTF-8”);
href="http://vignette3.wikia.nocookie.net/p