Java 如何使用jsoup从这个html页面获取文本?
我正在使用此代码检索本页主要文章中的文本Java 如何使用jsoup从这个html页面获取文本?,java,android,jsoup,Java,Android,Jsoup,我正在使用此代码检索本页主要文章中的文本 public class HtmlparserExampleActivity extends Activity { String outputtext; TagFindingVisitor visitor; Parser parser = null; private static final String TAG = "TVGuide"; TextView outputTextView; /** Called when the activ
public class HtmlparserExampleActivity extends Activity {
String outputtext;
TagFindingVisitor visitor;
Parser parser = null;
private static final String TAG = "TVGuide";
TextView outputTextView;
/** Called when the activity is first created. */
@Override
public void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.main);
outputTextView = (TextView)findViewById(R.id.outputTextView);
String id = "main-article-content";
Document doc = null;
try {
doc = Jsoup.connect("http://movies.ign.com/articles/100/1002569p1.html").get();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
Log.i("DOC", doc.toString().toString());
Elements elementsHtml = doc.getElementsByTag(id);
String[] temp1 = new String[99];
int i =0;
for(Element element: elementsHtml)
{
temp1[1] = element.text();
i++;
outputTextView.setText(temp1[1]);
问题是textview中没有显示任何内容。我试图检索的文本都没有出现。Log.i与调试日志中的段一起显示。所以我知道它连接成功了。只是不知道为什么我在文本视图中看不到任何文本。以下是你问题的相关内容的简化摘录:
Document doc = Jsoup.connect("http://movies.ign.com/articles/100/1002569p1.html").get();
Elements elementsHtml = doc.getElementsByTag("main-article-content");
// ...
你犯了一个根本性的错误。文档中没有类似
的HTML标记。但是,有一个
。根据CSS选择器概述,您应该使用#id
选择器
Document doc = Jsoup.connect("http://movies.ign.com/articles/100/1002569p1.html").get();
Element mainArticleContent = doc.select("#main-article-content").first();
// ...
非常感谢。为了更熟悉DOM和CSS,你会建议我做些什么来学习它们呢?用HTML和CSS开发一些网站(在一个单独的
.CSS
文件中!)。链接的Jsoup食谱概述就是您真正需要的。有关更高级的概述,请参阅w3感谢所有帮助。我对这一切都不熟悉。很抱歉给你带来了困惑。