Java 如何从文件中读取html?

Java 如何从文件中读取html?,java,html,file,w3c-validation,readfile,Java,Html,File,W3c Validation,Readfile,我有一个包含以下内容的文件: <!DOCTYPE html> <html> <head> <title>Hello, w3c validator!</title> <head> <body> <p>Hello again!</p>

我有一个包含以下内容的文件:

 <!DOCTYPE html> 
 <html>     
        <head>      
            <title>Hello, w3c validator!</title>    
        <head>
        <body>      
             <p>Hello again!</p>    
        </body> 
 </html>

你好,w3c验证器!
你好


如何用Java读取此文件并发送到validator-w3c?

您正在寻找的是一个Java程序,它:

  • 输入:HTML文件
  • 读取HTML文件
  • 验证文件(w3c验证)
  • 输出:验证输出
  • 对于第1点和第2点,您可以将战利品交给其他帖子:

    对于第3点,您可以检查如何联系w3c HTML验证程序的规范,但他们是这么说的:

    Note: Please be considerate in using this shared, free resource. 
    Consider Installing your own instance of the validator for smooth and fast operation. 
    Excessive use of the W3C Validation Service will be blocked.
    
    因此,我的建议是阅读本文以更好地了解您可以做什么,以及是否可以将其集成到Java程序中a:


    你的问题不是很清楚吗?你想做什么?@Kata我想他需要用JAva做一个小程序,作为输入得到HTML文件,作为输出给出文件的w3c验证输出。。。我是王瑞林吗?到目前为止,您是否尝试过一些东西?是否需要将html发送到在线验证程序?您是否考虑过使用html解析器和相应的DTD并进行自我验证?我正在尝试使用rexsl-w3c,它将数据发送到此站点。如果一个获取信息,关于我的页面是无效的-打印错误,但是,总是在控制台应用程序中获取“0”,我不知道为什么。。。