java获取字符串中的下几个单词

java获取字符串中的下几个单词,java,html,string,search,split,Java,Html,String,Search,Split,我试图搜索一个包含HTML的.txt文件。我需要在文件中搜索特定的HTML标记,然后抓取下面几个字符的代码。我是java新手,但我愿意学习我需要的东西 例如:假设我有代码:apr13,我只需要日期(apr13)。我该怎么做呢 非常感谢 查看并尝试找到搜索字符串的方法 既然你说你是从一个HTML文件中得到它,你可以看看哪个是HTML解析器,这将使搜索HTML文档中的字符串变得更容易 使用jsoup,您可以这样做 File input = new File("input.html"); Docu

我试图搜索一个包含HTML的.txt文件。我需要在文件中搜索特定的HTML标记,然后抓取下面几个字符的代码。我是java新手,但我愿意学习我需要的东西

例如:假设我有代码:
apr13
,我只需要日期(apr13)。我该怎么做呢

非常感谢

查看并尝试找到搜索字符串的方法

  • 既然你说你是从一个HTML文件中得到它,你可以看看哪个是HTML解析器,这将使搜索HTML文档中的字符串变得更容易
使用jsoup,您可以这样做

File input = new File("input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");

Elements spans = doc.select("span"); 
for (Element element : spans) {
    System.out.println(element.html());
}
试试这个

    Matcher m = Pattern.compile(">(.*?)<").matcher(s);
    while(m.find()) {
        String s = m.group(1);
    }

Matcher m=Pattern.compile(“>(*?)如果您想要的是基本的(我认为这会很好,因为您是新的),您可以使用以下方法:

if(s.indexOf("span class=\"date\"")!=0)
s=s.substring(s.indexOf(">")+1,s.lastIndexOf("<"));
if(s.indexOf(“span class=\“date\”)!=0)
s=s.substring(s.indexOf(“>”)+1,s.lastIndexOf(“
String yourString=“Apr 13”)

String date=yourString.split(“class=\“date\”>”)[1]。split("
抓取下面几个代码字符。
的定义是什么?您需要提供更多的信息。您正在搜索的文件中的示例、您正在寻找的模式以及最重要的是,您尝试过的内容将帮助我们更好地回答您的问题。这适用于问题的字符串。但是解析XML是困难的。是的,解析XML文件是困难的,但在我看来,如果你知道你想要的类的名称,你可以使用相同的方法来获取它们。如果你有1到10个不同的类,这是一个很好的方法。如果你有一个随机数目的类,那么最好使用另一个方法。
String yourString = "<span class=\"date\">Apr 13</span>"
String date = yourString.split("class=\"date\">")[1].split("</sp")[0];