如何使用java解析HTML页面中的特定项?
我正在尝试获取股票代码名,它是3-4个字母的代码,唯一地标识股票。下面是我试图使用的代码如何使用java解析HTML页面中的特定项?,java,html,html-parsing,jsoup,Java,Html,Html Parsing,Jsoup,我正在尝试获取股票代码名,它是3-4个字母的代码,唯一地标识股票。下面是我试图使用的代码 import java.io.IOException; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; public class Alpha { public static void main(Str
import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class Alpha {
public static void main(String[] args) {
Document doc;
try {
// need http protocol
doc = Jsoup.connect("http://www.bloomberg.com/markets/stocks/movers/ftse-100/").get();
// get page title
String title = doc.title();
System.out.println("title : " + title);
// get all links
Elements links = doc.select("a[href=");
for (Element link : links) {
// get the value from href attribute
System.out.println("\nlink : " + link.attr("href"));
System.out.println("text : " + link.text());
}
} catch (IOException e) {
e.printStackTrace();
}
然而,我不想得到所有的链接,而是想从网页上得到特定的链接。例如,我想要获取的一段数据的HTML代码是:
<tr class="odd">
<td class="first name">
<a href="/quote/AGK:LN">Aggreko PLC</a>
</td>
<td class="value">1,594.00</td>
<td class="change up">+52.00</td> <td class="delta up">+3.37%</td> <td class="value">1,561,246</td>
<td class="datetime">11:35:00</td>
</tr>
1,594.00
+52.00 +3.37% 1,561,246
11:35:00
使用tag/quote/AGK:LN在屏幕上输出的数据。如何使程序仅选择HTML的该部分
干杯在cssquery中,您只需输入值即可 像
“a[href='blablbla']”
所以试试这个
Elements links = doc.select("a[href='/quote/AGK:LN']");