如何从java中的url获取特殊单词
如何从java中的url获取特殊单词。我想从调用blabla的类中获取数据。 这是我的密码如何从java中的url获取特殊单词,java,url,Java,Url,如何从java中的url获取特殊单词。我想从调用blabla的类中获取数据。 这是我的密码 URL url = new URL("https://www.doviz.com/"); URLConnection connect = url.openConnection(); InputStream is = connect.getInputStream(); BufferedReader br = new BufferedReader(new InputStream
URL url = new URL("https://www.doviz.com/");
URLConnection connect = url.openConnection();
InputStream is = connect.getInputStream();
BufferedReader br = new BufferedReader(new InputStreamReader(is));
String line = null;
while((line = br.readLine()) != null)
{
System.out.println(line);
}
看一看,这将允许您获取网页的内容,而不是HTML代码。假设它将扮演浏览器的角色,它将把HTML标记解析为人类可读的文本
一旦你将你的页面内容变成一个字符串,你就可以使用任何出现次数计数算法来计算你的单词出现的次数
使用它的简单示例:
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
/* ........ */
String URL = "https://www.doviz.com/";
Document doc = Jsoup.connect(URL).get();
String text = doc.body().text();
System.out.println(text);
编辑
如果您不想使用解析器(正如您在注释中提到的,您不需要外部库),那么您将获得页面的整个HTML代码,这就是您可以做到的
try {
URL url = new URL("https://www.doviz.com/");
BufferedReader in = new BufferedReader(new InputStreamReader(url.openStream()));
String str;
while ((str = in.readLine()) != null) {
str = in.readLine().toString();
System.out.println(str);
/*str will get each time the new line, if you want to store the whole text in str
you can use concatenation (str+ = in.readLine().toString())*/
}
in.close();
} catch (Exception e) {}
欢迎来到StackOverflow!请查看“如何提问”页面:如果您包含更多详细信息,您可以获得更好的回答,例如“我想查找x,然后查找y。我尝试按照z进行操作,但没有成功,因为v”我向您保证,如果您可以添加这些详细信息,您将获得更好的回答。您是什么意思?你的意思是你想计算某个特定单词在网页中的出现次数?@MarsAtomic是的。有没有其他方法来获取网页内容?如果不使用外部库,据我所知,您将始终需要一个解析器(如Jsoup),否则您将获得HTML标记(实际上是页面的整个代码),这可能会使您在研究特定的word@Yuaud如果您不介意获取HTML代码,请阅读我答案中经过编辑的部分。如果我的回答对你有帮助,请点击左边的复选框,毫不犹豫地接受。感谢并祝您的项目好运:))