Java 如何解析网站?
我是Android开发新手。我一直在学习一本书:头先安卓开发-乔纳森·西蒙。我遇到了一个SAXParser实现,尽管代码似乎过时了,在线教程也过时了,或者没有显示如何从网站解析 SAXParser.javaJava 如何解析网站?,java,android,parsing,xml-parsing,saxparser,Java,Android,Parsing,Xml Parsing,Saxparser,我是Android开发新手。我一直在学习一本书:头先安卓开发-乔纳森·西蒙。我遇到了一个SAXParser实现,尽管代码似乎过时了,在线教程也过时了,或者没有显示如何从网站解析 SAXParser.java package com.example.saxparser; import java.io.InputStream; import java.net.URL; import javax.xml.parsers.SAXParserFactory;
package com.example.saxparser;
import java.io.InputStream;
import java.net.URL;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.Attributes;
import org.xml.sax.InputSource;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.DefaultHandler;
public class SAXParser extends DefaultHandler {
private String url = "http://www.w3schools.com/xml/note.xml";
private boolean inTitle = false;
private boolean inDescription = false;
private boolean inItem = false;
private String title = null;
private StringBuffer description = new StringBuffer();
public void processFeed() {
try {
SAXParserFactory factory =
SAXParserFactory.newInstance();
javax.xml.parsers.SAXParser parser = factory.newSAXParser();
XMLReader reader = parser.getXMLReader();
reader.setContentHandler(this);
InputStream inputStream = new URL(url).openStream();
reader.parse(new InputSource(inputStream));
} catch (Exception e) {}
}
public void startElements(String url, String localName, String qName, Attributes attributes) throws SAXException {
if (localName.startsWith("to")) { inItem = true; }
else if (inItem) {
if (localName.equals("from")) { inTitle = true; }
else { inTitle = false; }
if (localName.equals("heading")) { inDescription = true; }
else { inDescription = false; }
}
}
public void characters(char ch[], int start, int length) {
String chars = new String(ch).substring(start, start + length);
if (inTitle && title == null) { title = chars; }
if (inDescription) { description.append(chars); }
}
public String getTitle() { return title; }
public StringBuffer getDescription() { return description; }
}
MainActivity.java
package com.example.saxparser;
import android.os.Bundle;
import android.app.Activity;
import android.view.Menu;
import android.widget.TextView;
public class MainActivity extends Activity {
@Override
protected void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.activity_main);
SAXParser handler = new SAXParser();
handler.processFeed();
resetDisplay(handler.getTitle(), handler.getDescription());
}
@Override
public boolean onCreateOptionsMenu(Menu menu) {
// Inflate the menu; this adds items to the action bar if it is present.
getMenuInflater().inflate(R.menu.main, menu);
return true;
}
public void resetDisplay(String title, StringBuffer stringBuffer) {
TextView titleView = (TextView) findViewById(R.id.imageTitle);
titleView.setText(title);
TextView descriptionView = (TextView) findViewById(R.id.imageDescription);
descriptionView.setText(stringBuffer);
}
}
我也是Android开发领域的新手,到目前为止,我知道SAX可以用于XML文件解析器,但我不确定是否可以解析整个HTML。请记住,尽管HTML是SGML的一个子集(因此可以用SAX中相同的方法对其进行解析),但它可能很棘手(事实上,XML可以被视为HTML的近亲,SGML的侄子)。您可能会发现自己在动态加载方面遇到麻烦(如DaveNewton所说)。也许如果你多解释一点你的目标,我们都可以给你一个更详细的解释/建议(或者更深入地了解怜悯的提议),例如。。。承载您想要解析的内容的网站是否提供XML API?我想不会,因为您考虑了解析HTML而不是解析XMLAPI响应。请提供更多信息。与其他XML文档一样。也就是说,使用jsoup或类似的限制性较小的解析器,会更容易。当网站动态构建其DOM时,它会变得更加棘手,这种情况经常发生。哦,我的天,这太疯狂/过分了,试试看