Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/regex/18.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 通过模式组织文本的最佳方式?_Java_Regex - Fatal编程技术网

Java 通过模式组织文本的最佳方式?

Java 通过模式组织文本的最佳方式?,java,regex,Java,Regex,我搜集了一堆信息,需要将其组织成几个字段。唯一的问题是,在信息之前没有特定的头来识别它并创建模式和匹配器。我在下面包含了两组数据的信息。如图所示,标识符只是“左”或“中”,显示它们在屏幕上的位置。通过在每个数据集中的每个字段中添加,搜索并将每组数据组织到CSV中的最佳方式是什么?需要保存的数据将是“左”>或“中”>之后的所有内容 ERIK DAVIDOVIC等人5620 GOODMAN Drive North Royalton 44133-0000 488-05-029I01/02/2013 D

我搜集了一堆信息,需要将其组织成几个字段。唯一的问题是,在信息之前没有特定的头来识别它并创建模式和匹配器。我在下面包含了两组数据的信息。如图所示,标识符只是“左”或“中”,显示它们在屏幕上的位置。通过在每个数据集中的每个字段中添加,搜索并将每组数据组织到CSV中的最佳方式是什么?需要保存的数据将是“左”>或“中”>之后的所有内容

ERIK DAVIDOVIC等人5620 GOODMAN Drive North Royalton 44133-0000
488-05-029I01/02/2013
D.C.RUFUS等人的未知继承人等10603汉普顿大道克利夫兰44108-0000
109-16-094A01/02/2013
您可以使用类似的解析器来解析html文件,并使用选择器提取信息


希望能有所帮助。

事实上,这是一张非常结构化的桌子

您应该能够在
上进行分析,以知道新值正在开始,然后在
上开始一个新行


您只需数一数行中的哪个
就可以知道该值代表哪个列。

我将使用哪个类或多个类来执行此操作?模式和匹配器?如果是这样,我是否需要使用几个模式分隔符?可能。您可以对这些对使用一种模式,即=一行,然后在该循环中,对集合使用另一种模式
<td align="left">ERIK DAVIDOVIC, ET AL  </td><td align="left">5620 GOODMAN DRIVE</td><td align="center">NORTH ROYALTON</td><td align="center">44133-0000</td><td align="center">
                        <a id="SheetContentPlaceHolder_ctl00_gvForeclosureResutls_lbCaseNum_0" href="javascript:__doPostBack(&#39;ctl00$SheetContentPlaceHolder$ctl00$gvForeclosureResutls$ctl02$lbCaseNum&#39;,&#39;&#39;)" style="display:inline-block;width:100px;">CV-13-798497</a>
                    </td><td align="center">488-05-029</td><td align="center">I</td><td align="center">01/02/2013</td>
        </tr><tr style="background-color:Gainsboro;">


            <td align="left">UNKNOWN HEIRS, ETC OF D.C. RUFUS, ET AL  </td><td align="left">10603 HAMPDEN AVENUE</td><td align="center">CLEVELAND</td><td align="center">44108-0000</td><td align="center">
                        <a id="SheetContentPlaceHolder_ctl00_gvForeclosureResutls_lbCaseNum_1" href="javascript:__doPostBack(&#39;ctl00$SheetContentPlaceHolder$ctl00$gvForeclosureResutls$ctl03$lbCaseNum&#39;,&#39;&#39;)" style="display:inline-block;width:100px;">CV-13-798498</a>
                    </td><td align="center">109-16-094</td><td align="center">A</td><td align="center">01/02/2013</td>
        </tr><tr style="background-color:LightGrey;">