Java 使用web爬虫获取任何url/资源的命中计数_Java_Web Crawler_Jsoup

Java 使用web爬虫获取任何url/资源的命中计数

java web-crawler

Java 使用web爬虫获取任何url/资源的命中计数,java,web-crawler,jsoup,Java,Web Crawler,Jsoup,我用java制作了网络爬虫。它递归地遍历每个页面中的链接。现在我想得到一个特定页面的点击次数。可以通过网络爬虫吗？由于我们无法访问服务器代码，因此无法添加任何计数器来计算命中率。请提出解决方案。谢谢代码的基本结构是： ->获取url的html源代码。 ->从html代码中找到可访问的链接并将其放入列表中。 ->从列表中获取下一个链接并继续，直到列表变为空我只想显示每个链接的点击次数。我建议将链接包装到一个类中，让它有一个名为counter的变量来记录它。所以基本上你会有一个链接类的列表。示例

我用java制作了网络爬虫。它递归地遍历每个页面中的链接。现在我想得到一个特定页面的点击次数。可以通过网络爬虫吗？由于我们无法访问服务器代码，因此无法添加任何计数器来计算命中率。请提出解决方案。谢谢

代码的基本结构是：

->获取url的html源代码。 ->从html代码中找到可访问的链接并将其放入列表中。 ->从列表中获取下一个链接并继续，直到列表变为空

我只想显示每个链接的点击次数。

我建议将链接包装到一个类中，让它有一个名为counter的变量来记录它。所以基本上你会有一个

链接

类的列表。示例如下：

public class Link{
    private String url;
    private int count = 0;

    public Link(String url){
        this.url = url; // initialise your link class with a url
    }

    public String getUrl(){
        increment();
        return url;
    }

    public void increment(){
        count++;
    }

    public int getCount(){
        return count;
    }
}

然后像这样数数：

List<Link> links.... // initialise your links

Document doc = Jsoup.connect(links.get(i).getUrl()).get();

列出链接....//初始化你的链接
Document doc=Jsoup.connect（links.get（i）.getUrl（））.get（）；

这样，每次访问url时，计数都会增加以记录总点击量。

@SriHarshaKappala您可以看到基本结构。每次获得链接时，将其发送到主机，将该链接放入结构（fot实例，数组）中，并带有计数器。。。如果插入时，如果该链接已存在，则增加该计数器。。。