Java 如何从网站url获取html元素名称_Java_Apache Tika

Java 如何从网站url获取html元素名称

java

Java 如何从网站url获取html元素名称,java,apache-tika,Java,Apache Tika,我想获取HTML元素名和属性名（我不想使用documet.getElementsByTag（“*”或文档。选择（“*”）而不进行硬编码）是否有机会使用ApacheTika动态获取HTML元素名，如果可能，请提供示例 Document doc=Jsoup.connect("http://seenyc.co/").get(); Elements elements=doc.getAllElements(); for(Element ele:el

我想获取HTML元素名和属性名（我不想使用

documet.getElementsByTag（“*”

或

文档。选择（“*”

）而不进行硬编码）

是否有机会使用ApacheTika动态获取HTML元素名，如果可能，请提供示例

    Document doc=Jsoup.connect("http://seenyc.co/").get();
            Elements elements=doc.getAllElements();
            for(Element ele:elements){


                String  s=ele.tagName();
                Attributes n=ele.attributes();
                System.out.println(s);
                System.out.println(n);
}

HashSet allTags=new HashSet（）；
Document doc=Jsoup.connect（“http://seenyc.co/）.get（）；
Elements=doc.getAllegements（）；
用于（元素元素：元素）{
字符串s=ele.tagName（）；
属性n=元素属性（）；
所有标签。添加；
}
//在这里，您的哈希集将具有来自网站的所有不同标记名

这就是您想要的吗？

当然，您可以通过

childNodes

遍历子节点。您可以为我提供获取元素名称的示例代码吗？否，您可以自己搜索API。提示：节点有名称。实际上，我试过使用jsoup，但没有找到任何方法来获取元素名称。我也试过使用DOM，但它期待良好的格式？RTFM！

   HashSet<String> allTags=new HashSet<String>();
   Document doc=Jsoup.connect("http://seenyc.co/").get();
            Elements elements=doc.getAllElements();
            for(Element ele:elements){
                String  s=ele.tagName();
                Attributes n=ele.attributes();
                allTags.add(s);
}

// here your hashset will have all distinct tag names from website