解析<;保险商等级=”;新闻列表“&燃气轮机;用Java

解析<;保险商等级=”;新闻列表“&燃气轮机;用Java,java,html,parsing,Java,Html,Parsing,如何使用Java解析具有特定类类型的HTML文档中的ul元素? 我想从HTML中解析此部分: <ul class="news-list"> <li> <a onclick="AjaxStatManager('Content','1258')" href="http://www.gyte.edu.tr/icerik/120/1258/kim-101-final-mazeret-sinav

如何使用Java解析具有特定类类型的HTML文档中的ul元素? 我想从HTML中解析此部分:

<ul class="news-list">            

            <li>
                <a onclick="AjaxStatManager('Content','1258')" href="http://www.gyte.edu.tr/icerik/120/1258/kim-101-final-mazeret-sinavi.aspx" target="_self"> 
                    <div class="text">
                        <h2>KİM 101 Final Mazeret Sınavı</h2>
                        <p></p>

                    </div>
                </a>
            </li>

            <li>
                <a onclick="AjaxStatManager('Content','1248')" href="http://www.gyte.edu.tr/icerik/120/1248/butunleme-sinav-tarihleri.aspx" target="_self"> 
                    <div class="text">
                        <h2>Bütünleme Sınav Tarihleri</h2>
                        <p></p>

                    </div>
                </a>
            </li>

            <li>
                <a onclick="AjaxStatManager('Content','1242')" href="http://www.gyte.edu.tr/icerik/120/1242/bil-374-internet-teknolojileri-final-sinavi.aspx" target="_self"> 
                    <div class="text">
                        <h2>Bil 374 İnternet Teknolojileri Final Sınavı</h2>
                        <p></p>

                    </div>
                </a>
            </li>

            <li>
                <a onclick="AjaxStatManager('Content','1241')" href="http://www.gyte.edu.tr/icerik/120/1241/kim101-final-sinavi.aspx" target="_self"> 
                    <div class="text">
                        <h2>Kim101 Final Sınavı </h2>
                        <p></p>

                    </div>
                </a>
            </li>

            <li>
                <a onclick="AjaxStatManager('Content','1222')" href="/Files/UserFiles/85/duyurular/yeterlilik.pdf" target="_self"> 
                    <div class="text">
                        <h2>Doktora Yeterlilik Sınav Tarihleri</h2>
                        <p></p>

                    </div>
                </a>
            </li>

            <li>
                <a onclick="AjaxStatManager('Content','1221')" href="/Files/UserFiles/85/duyurular/duyuru-dokt-seminer.pdf" target="_self"> 
                    <div class="text">
                        <h2>Doktora Programı Adaylarına Önemli Duyuru</h2>
                        <p></p>

                    </div>
                </a>
            </li>

            <li>
                <a onclick="AjaxStatManager('Content','1127')" href="http://www.gyte.edu.tr/icerik/120/1127/20122013-egitimogretim-yili-guz-yari-yili--final-programi.aspx" target="_self"> 
                    <div class="text">
                        <h2>2012-2013 Eğitim-Öğretim Yılı Güz Yarı Yılı  Final Programı</h2>
                        <p></p>

                    </div>
                </a>
            </li>

            <li>
                <a onclick="AjaxStatManager('Content','1109')" href="/Files/UserFiles/85/duyurular/Yüksek Lisans  Doktora Seminer I ve II Sunum Takvimi.pdf" target="_self"> 
                    <div class="text">
                        <h2>Yüksek Lisans / Doktora Seminer I ve II Sunum Takvimi</h2>
                        <p></p>

                    </div>
                </a>
            </li>

            <li>
                <a onclick="AjaxStatManager('Content','998')" href="http://www.gyte.edu.tr/icerik/120/998/bilgisayar-muhendisligi-bolumu-20122013-guz-yari-yili-ders-programlari.aspx" target="_self"> 
                    <div class="text">
                        <h2>Bilgisayar Mühendisliği Bölümü 2012-2013 Güz Yarı Yılı Ders Programları</h2>
                        <p>Bilgisayar Mühendisliği Bölümü 2012-2013 Güz Yarı Yılı Ders Programları</p>

                    </div>
                </a>
            </li>

            <li>
                <a onclick="AjaxStatManager('Content','1101')" href="http://www.gyte.edu.tr/icerik/120/1101/kim-101-kimya-dersi---ii-vizesi.aspx" target="_self"> 
                    <div class="text">
                        <h2>KİM 101 Kimya Dersi   II .vizesi</h2>
                        <p></p>

                    </div>
                </a>
            </li>

            <li>
                <a onclick="AjaxStatManager('Content','1073')" href="/Files/duyuru/bilgisayar_muh/Yuksek_lisans_-_Doktora_Seminer_I_-_II.pdf" target="_self"> 
                    <div class="text">
                        <h2>Yüksek Lisans/Doktora Seminer I ve II Ders Planı</h2>
                        <p></p>

                    </div>
                </a>
            </li>

            <li>
                <a onclick="AjaxStatManager('Content','1058')" href="/Files/duyuru/bilgisayar_muh/bil495-496syl.pdf" target="_self"> 
                    <div class="text">
                        <h2>BIL 495/496 Bitirme Projesi Ders Planı</h2>
                        <p></p>

                    </div>
                </a>
            </li>

            <li>
                <a onclick="AjaxStatManager('Content','1006')" href="/Files/duyuru/bilgisayar_muh/duy-ders2013guz_1.doc" target="_self"> 
                    <div class="text">
                        <h2>G.Y.T.E. Lisans Üstü Öğrencilerinin Dikkatine</h2>
                        <p></p>

                    </div>
                </a>
            </li>

            <li>
                <a onclick="AjaxStatManager('Content','984')" href="http://www.gyte.edu.tr/icerik/120/984/bil-341-programlama-dilleri-butunleme-sinavi.aspx" target="_self"> 
                    <div class="text">
                        <h2>BİL 341 Programlama Dilleri bütünleme sınavı</h2>
                        <p></p>

                    </div>
                </a>
            </li>

</ul>

您可以将其加载到对象中。这将为您读入HTML,您可以使用可用的方法进行迭代/查询。

我认为它适用于XPATH查询

XPath xpath = XPathFactory.newInstance().newXPath(); 
String expression= "//ul[@class = 'news-list']"; 
InputSource inputSource = new InputSource("your.html"); 
NodeSet nodes = (NodeSet) xpath.evaluate(expression, inputSource, XPathConstants.NODESET);

以下是JSoup解决方案:

try {
    Document doc = Jsoup.parse(new URL("http://www.gyte.edu.tr/kategori/120/0/duyurular.aspx"), 1000000);
    Elements elements = doc.getElementsByAttributeValue("class", "news-list");
    System.out.println(elements.size());

    for (Element e : elements) {
        System.out.println(e.toString());
    }
} catch (Exception e) {
    e.printStackTrace();
}
以及输出:

 <ul class="news-list"> 
 <li> <a onclick="AjaxStatManager('Content','1258')" href="http://www.gyte.edu.tr/icerik/120/1258/kim-101-final-mazeret-sinavi.aspx" target="_self"> 
   <div class="text"> 
    <h2>KİM 101 Final Mazeret Sınavı</h2> 
    <p></p> 
   </div> </a> </li> 
 <li> <a onclick="AjaxStatManager('Content','1248')" href="http://www.gyte.edu.tr/icerik/120/1248/butunleme-sinav-tarihleri.aspx" target="_self"> 
   <div class="text"> 
    <h2>B&uuml;t&uuml;nleme Sınav Tarihleri</h2> 
    <p></p> 
   </div> </a> </li> 
 <li> <a onclick="AjaxStatManager('Content','1242')" href="http://www.gyte.edu.tr/icerik/120/1242/bil-374-internet-teknolojileri-final-sinavi.aspx" target="_self"> 
   <div class="text"> 
    <h2>Bil 374 İnternet Teknolojileri Final Sınavı</h2> 
    <p></p> 
   </div> </a> </li> 
 <li> <a onclick="AjaxStatManager('Content','1241')" href="http://www.gyte.edu.tr/icerik/120/1241/kim101-final-sinavi.aspx" target="_self"> 
   <div class="text"> 
    <h2>Kim101 Final Sınavı </h2> 
    <p></p> 
   </div> </a> </li> 
 <li> <a onclick="AjaxStatManager('Content','1222')" href="/Files/UserFiles/85/duyurular/yeterlilik.pdf" target="_self"> 
   <div class="text"> 
    <h2>Doktora Yeterlilik Sınav Tarihleri</h2> 
    <p></p> 
   </div> </a> </li> 
 <li> <a onclick="AjaxStatManager('Content','1221')" href="/Files/UserFiles/85/duyurular/duyuru-dokt-seminer.pdf" target="_self"> 
   <div class="text"> 
    <h2>Doktora Programı Adaylarına &Ouml;nemli Duyuru</h2> 
    <p></p> 
   </div> </a> </li> 
 <li> <a onclick="AjaxStatManager('Content','1127')" href="http://www.gyte.edu.tr/icerik/120/1127/20122013-egitimogretim-yili-guz-yari-yili--final-programi.aspx" target="_self"> 
   <div class="text"> 
    <h2>2012-2013 Eğitim-&Ouml;ğretim Yılı G&uuml;z Yarı Yılı Final Programı</h2> 
    <p></p> 
   </div> </a> </li> 
 <li> <a onclick="AjaxStatManager('Content','1109')" href="/Files/UserFiles/85/duyurular/Y&uuml;ksek Lisans  Doktora Seminer I ve II Sunum Takvimi.pdf" target="_self"> 
   <div class="text"> 
    <h2>Y&uuml;ksek Lisans / Doktora Seminer I ve II Sunum Takvimi</h2> 
    <p></p> 
   </div> </a> </li> 
 <li> <a onclick="AjaxStatManager('Content','998')" href="http://www.gyte.edu.tr/icerik/120/998/bilgisayar-muhendisligi-bolumu-20122013-guz-yari-yili-ders-programlari.aspx" target="_self"> 
   <div class="text"> 
    <h2>Bilgisayar M&uuml;hendisliği B&ouml;l&uuml;m&uuml; 2012-2013 G&uuml;z Yarı Yılı Ders Programları</h2> 
    <p>Bilgisayar M&uuml;hendisliği B&ouml;l&uuml;m&uuml; 2012-2013 G&uuml;z Yarı Yılı Ders Programları</p> 
   </div> </a> </li> 
 <li> <a onclick="AjaxStatManager('Content','1101')" href="http://www.gyte.edu.tr/icerik/120/1101/kim-101-kimya-dersi---ii-vizesi.aspx" target="_self"> 
   <div class="text"> 
    <h2>KİM 101 Kimya Dersi II .vizesi</h2> 
    <p></p> 
   </div> </a> </li> 
 <li> <a onclick="AjaxStatManager('Content','1073')" href="/Files/duyuru/bilgisayar_muh/Yuksek_lisans_-_Doktora_Seminer_I_-_II.pdf" target="_self"> 
   <div class="text"> 
    <h2>Y&uuml;ksek Lisans/Doktora Seminer I ve II Ders Planı</h2> 
    <p></p> 
   </div> </a> </li> 
 <li> <a onclick="AjaxStatManager('Content','1058')" href="/Files/duyuru/bilgisayar_muh/bil495-496syl.pdf" target="_self"> 
   <div class="text"> 
    <h2>BIL 495/496 Bitirme Projesi Ders Planı</h2> 
    <p></p> 
   </div> </a> </li> 
 <li> <a onclick="AjaxStatManager('Content','1006')" href="/Files/duyuru/bilgisayar_muh/duy-ders2013guz_1.doc" target="_self"> 
   <div class="text"> 
    <h2>G.Y.T.E. Lisans &Uuml;st&uuml; &Ouml;ğrencilerinin Dikkatine</h2> 
    <p></p> 
   </div> </a> </li> 
 <li> <a onclick="AjaxStatManager('Content','984')" href="http://www.gyte.edu.tr/icerik/120/984/bil-341-programlama-dilleri-butunleme-sinavi.aspx" target="_self"> 
   <div class="text"> 
    <h2>BİL 341 Programlama Dilleri b&uuml;t&uuml;nleme sınavı</h2> 
    <p></p> 
   </div> </a> </li> 
</ul>

你在什么环境下使用“解析”。你在用这些信息做什么,等等。你能把你的问题扩大一点,让回答问题的人有更多的环境,知道如何回答。研究它对html解析很有用。我已经做过了。但是我怎样才能找到具有类名的元素呢?请看前面回答的问题,---这应该是一个很好的起点。@zylth非常感谢:)
 <ul class="news-list"> 
 <li> <a onclick="AjaxStatManager('Content','1258')" href="http://www.gyte.edu.tr/icerik/120/1258/kim-101-final-mazeret-sinavi.aspx" target="_self"> 
   <div class="text"> 
    <h2>KİM 101 Final Mazeret Sınavı</h2> 
    <p></p> 
   </div> </a> </li> 
 <li> <a onclick="AjaxStatManager('Content','1248')" href="http://www.gyte.edu.tr/icerik/120/1248/butunleme-sinav-tarihleri.aspx" target="_self"> 
   <div class="text"> 
    <h2>B&uuml;t&uuml;nleme Sınav Tarihleri</h2> 
    <p></p> 
   </div> </a> </li> 
 <li> <a onclick="AjaxStatManager('Content','1242')" href="http://www.gyte.edu.tr/icerik/120/1242/bil-374-internet-teknolojileri-final-sinavi.aspx" target="_self"> 
   <div class="text"> 
    <h2>Bil 374 İnternet Teknolojileri Final Sınavı</h2> 
    <p></p> 
   </div> </a> </li> 
 <li> <a onclick="AjaxStatManager('Content','1241')" href="http://www.gyte.edu.tr/icerik/120/1241/kim101-final-sinavi.aspx" target="_self"> 
   <div class="text"> 
    <h2>Kim101 Final Sınavı </h2> 
    <p></p> 
   </div> </a> </li> 
 <li> <a onclick="AjaxStatManager('Content','1222')" href="/Files/UserFiles/85/duyurular/yeterlilik.pdf" target="_self"> 
   <div class="text"> 
    <h2>Doktora Yeterlilik Sınav Tarihleri</h2> 
    <p></p> 
   </div> </a> </li> 
 <li> <a onclick="AjaxStatManager('Content','1221')" href="/Files/UserFiles/85/duyurular/duyuru-dokt-seminer.pdf" target="_self"> 
   <div class="text"> 
    <h2>Doktora Programı Adaylarına &Ouml;nemli Duyuru</h2> 
    <p></p> 
   </div> </a> </li> 
 <li> <a onclick="AjaxStatManager('Content','1127')" href="http://www.gyte.edu.tr/icerik/120/1127/20122013-egitimogretim-yili-guz-yari-yili--final-programi.aspx" target="_self"> 
   <div class="text"> 
    <h2>2012-2013 Eğitim-&Ouml;ğretim Yılı G&uuml;z Yarı Yılı Final Programı</h2> 
    <p></p> 
   </div> </a> </li> 
 <li> <a onclick="AjaxStatManager('Content','1109')" href="/Files/UserFiles/85/duyurular/Y&uuml;ksek Lisans  Doktora Seminer I ve II Sunum Takvimi.pdf" target="_self"> 
   <div class="text"> 
    <h2>Y&uuml;ksek Lisans / Doktora Seminer I ve II Sunum Takvimi</h2> 
    <p></p> 
   </div> </a> </li> 
 <li> <a onclick="AjaxStatManager('Content','998')" href="http://www.gyte.edu.tr/icerik/120/998/bilgisayar-muhendisligi-bolumu-20122013-guz-yari-yili-ders-programlari.aspx" target="_self"> 
   <div class="text"> 
    <h2>Bilgisayar M&uuml;hendisliği B&ouml;l&uuml;m&uuml; 2012-2013 G&uuml;z Yarı Yılı Ders Programları</h2> 
    <p>Bilgisayar M&uuml;hendisliği B&ouml;l&uuml;m&uuml; 2012-2013 G&uuml;z Yarı Yılı Ders Programları</p> 
   </div> </a> </li> 
 <li> <a onclick="AjaxStatManager('Content','1101')" href="http://www.gyte.edu.tr/icerik/120/1101/kim-101-kimya-dersi---ii-vizesi.aspx" target="_self"> 
   <div class="text"> 
    <h2>KİM 101 Kimya Dersi II .vizesi</h2> 
    <p></p> 
   </div> </a> </li> 
 <li> <a onclick="AjaxStatManager('Content','1073')" href="/Files/duyuru/bilgisayar_muh/Yuksek_lisans_-_Doktora_Seminer_I_-_II.pdf" target="_self"> 
   <div class="text"> 
    <h2>Y&uuml;ksek Lisans/Doktora Seminer I ve II Ders Planı</h2> 
    <p></p> 
   </div> </a> </li> 
 <li> <a onclick="AjaxStatManager('Content','1058')" href="/Files/duyuru/bilgisayar_muh/bil495-496syl.pdf" target="_self"> 
   <div class="text"> 
    <h2>BIL 495/496 Bitirme Projesi Ders Planı</h2> 
    <p></p> 
   </div> </a> </li> 
 <li> <a onclick="AjaxStatManager('Content','1006')" href="/Files/duyuru/bilgisayar_muh/duy-ders2013guz_1.doc" target="_self"> 
   <div class="text"> 
    <h2>G.Y.T.E. Lisans &Uuml;st&uuml; &Ouml;ğrencilerinin Dikkatine</h2> 
    <p></p> 
   </div> </a> </li> 
 <li> <a onclick="AjaxStatManager('Content','984')" href="http://www.gyte.edu.tr/icerik/120/984/bil-341-programlama-dilleri-butunleme-sinavi.aspx" target="_self"> 
   <div class="text"> 
    <h2>BİL 341 Programlama Dilleri b&uuml;t&uuml;nleme sınavı</h2> 
    <p></p> 
   </div> </a> </li> 
</ul>