Java 我对InputstreamReader和html有问题

Java 我对InputstreamReader和html有问题,java,html,regex,inputstreamreader,Java,Html,Regex,Inputstreamreader,我试图使用java从URL中删除一个表内容,但刮板显然无法正常工作。我在inputstreamReader和其他在线示例中使用了java文档,但无法找出问题所在。问题在于,inputstreamReader在获取最后一列时跳过表中每偶数行的两列。每个奇数行产生所需的结果。下面是我的代码和输出 源表如下所示: 最后,输出如下所示: 在html术语中,行中的每一列都是一个标记,作为行读入。由于跳过了两列,这是否意味着inputStreamReader跳过了两行?我认为这可能是一个正则表达式问题,

我试图使用java从URL中删除一个表内容,但刮板显然无法正常工作。我在inputstreamReader和其他在线示例中使用了java文档,但无法找出问题所在。问题在于,inputstreamReader在获取最后一列时跳过表中每偶数行的两列。每个奇数行产生所需的结果。下面是我的代码和输出

源表如下所示:

最后,输出如下所示:


在html术语中,行中的每一列都是一个标记,作为行读入。由于跳过了两列,这是否意味着inputStreamReader跳过了两行?我认为这可能是一个正则表达式问题,但这不可能是原因,因为输出的其余部分是正确的。我希望能够正确地输出或读取所有行和列,以便能够继续

奇数行和偶数行的价格模式不同

奇数行:

    <tr>
        <td>16:00:52</td>
        <td>$&nbsp;82.14&nbsp; </td>
        <td>763</td>
    </tr>

16:00:52
$ 82.14  
763
偶数行:

    <tr>
        <td>16:00:52 </td>
        <td>$&nbsp;82.14 &nbsp;</td>
        <td>8,116</td>
    </tr>

16:00:52 
$ 82.14  
8,116
匹配这两种情况的模式是:

String preicePattern = "<td>\\$&.+;(\\d{1,4}\\.\\d{1,4}) *&";
String preicePattern=“\\$&.+;(\\d{1,4}\\\.\\d{1,4})*&”;

仔细检查您的正则表达式…确保它们考虑了每个表项的语法变化(例如合理的空格)。您好,Saka129,您的示例对我不起作用,但我能够通过使用:String preicePattern=“\\\$&.+;(\\d{1,4}\\\\\\\\d{1,4})*&”解决问题;