Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/powerbi/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Html parsing 如何找到<;部门>;使用Xerces-J使用特定属性值进行标记?_Html Parsing - Fatal编程技术网

Html parsing 如何找到<;部门>;使用Xerces-J使用特定属性值进行标记?

Html parsing 如何找到<;部门>;使用Xerces-J使用特定属性值进行标记?,html-parsing,Html Parsing,我在Java中使用Xerces。我想解析一个HTML文档,找到一个具有特定属性(例如id=myID)的div元素。在找到上述元素后,我想返回div中的文本内容。我无法在Xerces在线找到任何此类示例 例如: <div id="myId">foo</div> foo 这应该会返回foo。很抱歉,使用Xerces-J无法回答此问题,但有一个名为的库专门为这类问题而设计(尽管我相信Xerces也可以做到这一点)。这有点像Java的Javascript。Jsoup允许您执行

我在Java中使用Xerces。我想解析一个HTML文档,找到一个具有特定属性(例如id=myID)的div元素。在找到上述元素后,我想返回div中的文本内容。我无法在Xerces在线找到任何此类示例

例如:

<div id="myId">foo</div>
foo

这应该会返回foo。

很抱歉,使用Xerces-J无法回答此问题,但有一个名为的库专门为这类问题而设计(尽管我相信Xerces也可以做到这一点)。这有点像Java的Javascript。Jsoup允许您执行以下操作:

String html = "<div id=\"myId\">foo</div>";
Document doc = Jsoup.parse(html);
String divfoo = doc.getElementById("myId").text();
System.out.println(divfoo);
String html=“foo”;
Document doc=Jsoup.parse(html);
字符串divfoo=doc.getElementById(“myId”).text();
System.out.println(divfoo);

你觉得怎么样?

你和Xerces有关系吗?你能使用另一个库吗?我可能不喜欢它,但我正在寻找一个Java库,因为我在Hadoop中使用Java编程。我最需要的是速度。我不是一个真正的CS人,所以我只是边走边学。谢谢你的帮助,谢谢你的提醒。我尝试使用以下方法:Document doc=Jsoup.connect(urlString.get();结果=doc.getElementById(“myID”).text();但连接在第一步时超时。。。我相信是因为需要通过我这边的代理。我试过:System.setProperty(“http.proxyHost”,myProxy);setProperty(“http:proxyPort”,myPort);这似乎也没什么帮助。另一方面,我确实在Xerces-J上找到了getElementById的文档。不过,我也有同样的代理问题。您可以尝试使用这些JVM参数来通过代理:-Dhttp.proxyHost=myproxy.company.com-Dhttp.proxyPort=80如果您使用的是Eclipse,您可以将其放入“运行配置”中的“VM参数”中. 如果您在命令行上执行此操作,我认为您可以在java命令之后立即输入它们。我试了一下,但还是不行。不过我很感谢你的帮助。