文本文件解析Java
我有一个文本文件,看起来像XML文件,但它不是有效的XML文件。 我如何解析它?我正在使用Java。 我需要最后一个标签的内容 示例文件:文本文件解析Java,java,parsing,Java,Parsing,我有一个文本文件,看起来像XML文件,但它不是有效的XML文件。 我如何解析它?我正在使用Java。 我需要最后一个标签的内容 示例文件: <h4 class="is24qa-objektbeschreibung-label padding-top-xl margin-bottom- s">Objektbeschreibung</h4> <div class="is24-text margin-bottom"> <pre c
<h4 class="is24qa-objektbeschreibung-label padding-top-xl margin-bottom- s">Objektbeschreibung</h4>
<div class="is24-text margin-bottom">
<pre class="is24qa-objektbeschreibung">TEST TEST TEST </pre>
Objektbeschreibung
测试
您可以这样使用jsoup
package com.company;
import java.io.*;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class Main {
public static void main(String[] args) {
String line;
String cline = "";
Document doc;
try {
BufferedReader br = new BufferedReader(new FileReader("input.txt"));
while ((line = br.readLine()) != null) {
cline = line;
}
doc = Jsoup.parse(cline);
Elements elements = doc.select("body").first().children();
for (Element el : elements)
System.out.println("content: " + el.text());
} catch (IOException e) {
e.printStackTrace();
}
}
}
input.txt
<h4 class="is24qa-objektbeschreibung-label padding-top-xl margin-bottom- s">Objektbeschreibung</h4>
<div class="is24-text margin-bottom">
<pre class="is24qa-objektbeschreibung">TEST TEST TEST </pre>
/usr/lib/jvm/java-1.8.0-openjdk-amd64/bin/java -
content: TEST TEST TEST
Process finished with exit code 0