Java文件解析与通过http获取html

Java文件解析与通过http获取html,java,http,tcp,apache2,httpclient,Java,Http,Tcp,Apache2,Httpclient,我们有一个Java类,它应该获取一个HTML文件,然后根据某些div的id读取其中的一些内容,然后将内容返回给前端,前端将呈现它 现在我们在网络上的某个公共文件系统上有一组HTML文件。多个应用程序将访问它。它就像是一个针对我们面向客户的屏幕的自制GUI帮助指南,具有集中存储功能 我们通过两种方式加载html文件 启动ApacheWeb服务器并将所有html文件放入htdocs中。然后,调用Java类进行http调用http://someIP:80/helpguide/userguide.htm

我们有一个Java类,它应该获取一个HTML文件,然后根据某些div的id读取其中的一些内容,然后将内容返回给前端,前端将呈现它

现在我们在网络上的某个公共文件系统上有一组HTML文件。多个应用程序将访问它。它就像是一个针对我们面向客户的屏幕的自制GUI帮助指南,具有集中存储功能

我们通过两种方式加载html文件

  • 启动ApacheWeb服务器并将所有html文件放入htdocs中。然后,调用Java类进行http调用
    http://someIP:80/helpguide/userguide.html #firstname。
    这将获取屏幕上与firstname字段相关的帮助指南。必须对Apache服务进行管理,因为它可以在Live中访问,但只能在我们的网络中访问

  • 创建一个共享目录,并将对该目录的访问权授予用于运行运行Tomcat的Windows服务的Windows登录,该Windows服务在部署面向客户端的web应用程序时运行。然后Java客户机类使用
    新文件(“”
    加载文件并读取其内容。这同样有效

  • 基本上,我们有两种加载html文件的方法。现在我们不知道是使用1号线还是2号线

    html文件不会那么庞大,并且大小合理。它可能有内嵌的css或youtube视频链接

    (2)的缺点是,如果我们想在以后包含图像,它将无法工作,而它应该与(1)一起工作


    然而,在性能和效率方面,这两种方法有什么不同?(1) 将通过端口80打开Http套接字连接,并获取html流。使用(2)时,它可能会使用文件输入流在服务器上获取文件。

    “如果我们以后要包含图像,它将无法工作”,即使它看起来不象:在方法2中,由于涉及CIFS共享,您还必须打开套接字连接。这将是fge。基本上,我们计划得到嵌入图像的html。图像存储在html所在的位置。但是,当使用文件系统加载器时,我们只获取图像,而不获取与html相关的图像。我知道这在网络应用程序上更优雅,但我们想要一些非常简单的东西,而那些将要创建这个html和图像截图的人不会那么精通技术——因此,我们要寻找最简单的解决方案。我们更倾向于使用ApacheWeb服务器,因为需要注意的是通过http端口的防火墙访问