Android 解析blockquote中的p标记

Android 解析blockquote中的p标记,android,html,dom,jsoup,Android,Html,Dom,Jsoup,我正试图找到blockquote中的一些p标签。在html的这一部分中,我尝试访问具有以下特性的p标记: font face=“Verdana,Arial,Helvetica,sans serif”size=“2” 我指的是最后2个p标签,带有 font face=“Verdana,Arial,Helvetica,sans serif”size=“2” 阿坝阿尔丁丹 萨科切梅克:(d)-(ar-türk.f.)-辛塞尔·居尔库尼的耶特西兹·比尔吉尔勒·比尔克 tartmayaçalışş

我正试图找到blockquote中的一些p标签。在html的这一部分中,我尝试访问具有以下特性的p标记:

font face=“Verdana,Arial,Helvetica,sans serif”size=“2”

我指的是最后2个p标签,带有

font face=“Verdana,Arial,Helvetica,sans serif”size=“2”


阿坝阿尔丁丹 萨科切梅克:(d)-(ar-türk.f.)-辛塞尔·居尔库尼的耶特西兹·比尔吉尔勒·比尔克 tartmayaçalışşmak&;阿兹·比尔盖尔·比尔埃因·阿斯勒尼比莱切尼·桑马克(Az bilgiyle birşeyin aslınığrenebileceğini sanmak)。 “奥卡达尔·达莱拉·奥伦马兹·卡丹·卡丹·卡丹·西科洛梅耶先生 soyun sonra da o siki görünce bas yaygarayı!”

ABAROT GÖT:(d)-(好的)-圣母玛利亚 撒旦,哈瓦·阿坦·基伊。“阿玛·阿巴罗·格图姆·苏恩·安南先生,格伦·德 sol taşaktan dştün sanır.“

他们没有任何身份证、标签等

  • 我怎样才能找到他们
  • 处理此类要素的最佳方式是什么
  • 例如,我可以通过它的行号来解析html吗
如果您确定元素始终包含在指定的字体标记中,则可以在以下情况下使用这些元素:

附录

我现在尝试使用您提供的URL:

String url = "http://ikra4.tripod.com/kadinargo/a.html";
Document doc= Jsoup.parse(new URL(url).openStream(), "ISO-8859-9", url);

Elements els = doc.select("blockquote p font[face=Verdana, Arial, Helvetica, sans-serif]");
for (Element e : els){
  System.out.println(e.text());
} 

请注意,网站不会使用指示所用编码的正确HTTP头进行响应。JSoup返回到您正在运行的系统的编码,这可能是错误的。因此,您需要使用带有显式编码信息的
URL.openStream
来获取所需的页面。

最后一行真的是
?我想应该是
。是的。我只是放了网站的一部分。确切的来源可以在这里找到;查看资料来源:我投票结束这个问题,因为这篇文章包含了太多的土耳其语俚语。我认为用户问这个问题的目的是不好的。用户创建了一个新用户来问这个问题。这很符合逻辑。但它不起作用。你知道为什么它不起作用吗?我试图把它记录下来,但什么也没有显示;查看来源:我无法管理它,但它仍然会给出一个错误。。
String html = ""
            +"<blockquote> "
            +"<p>&nbsp;</p>"
            +"<p><a href=\"../index.html\"><img src=\"\"align=\"right\" border=\"0\"></a></p>"
            +"<p><img src=\"baslik.gif\" width=\"308\" height=\"80\"></p>"
            +"<a href=\"e.html\">E</a> <a href=\"f.html\">F</a> <a href=\"g.html\">G</a> "

            +"<p><font face=\"Verdana, Arial, Helvetica, sans-serif\" size=\"2\">ABA ALTINDAN "
            +"SİK ÖLÇMEK: (d)-(ar.-türk. f.)-Yetersiz bilgilerle bir erkeğin cinsel gücünü "
            +"tartmaya çalışmak &amp; Az bilgiyle bir şeyin aslını öğrenebileceğini sanmak. "
            +"&quot;O kadar da leyla olunmaz ki canım. Sen kalk aba altından sik ölçmeye "
            +"soyun sonra da o siki görünce bas yaygarayı!&quot;</font></p>"
            +"<p><font face=\"Verdana, Arial, Helvetica, sans-serif\" size=\"2\">ABAROT GÖT: (d)-(o.k)-Çalım "
            +"satan, hava atan kişi. &quot;Sen de amma abarot götmüşsün annem, gören de "
            +"sol taşaktan düştün sanır.&quot;</font></p>"
            +"</blockquote>";
Document doc = Jsoup.parse(html);
Elements els = doc.select("blockquote p font[face=Verdana, Arial, Helvetica, sans-serif]");
for (Element e : els){
  System.out.println(e.text());
} 
ABA ALTINDAN SİK ÖLÇMEK: (d)-(ar.-türk. f.)-Yetersiz bilgilerle bir erkeğin cinsel gücünü tartmaya çalışmak & Az bilgiyle bir şeyin aslını öğrenebileceğini sanmak. "O kadar da leyla olunmaz ki canım. Sen kalk aba altından sik ölçmeye soyun sonra da o siki görünce bas yaygarayı!"
ABAROT GÖT: (d)-(o.k)-Çalım satan, hava atan kişi. "Sen de amma abarot götmüşsün annem, gören de sol taşaktan düştün sanır."
String url = "http://ikra4.tripod.com/kadinargo/a.html";
Document doc= Jsoup.parse(new URL(url).openStream(), "ISO-8859-9", url);

Elements els = doc.select("blockquote p font[face=Verdana, Arial, Helvetica, sans-serif]");
for (Element e : els){
  System.out.println(e.text());
}