WebCollector无法分析查询Java_Java_Parsing_Token

WebCollector无法分析查询Java

java parsing

WebCollector无法分析查询Java,java,parsing,token,Java,Parsing,Token,运行上述代码后，这就是我得到的 “无法分析查询“”：位于“：//bbs.gter.net/thread”的意外标记。” 我能做什么？你应该这样做： public Links visitAndGetNextLinks(Page page) { String url = page.getUrl(); if (Pattern.matches("http://bbs.gter.net/forum-1033-.*", url)) { Lin

运行上述代码后，这就是我得到的

“无法分析查询“”：位于“：//bbs.gter.net/thread”的意外标记。”

我能做什么？

你应该这样做：

    public Links visitAndGetNextLinks(Page page) {
        String url = page.getUrl();

        if (Pattern.matches("http://bbs.gter.net/forum-1033-.*", url)) {
            Links nextLinks=new Links();


            nextLinks.addAllFromDocument(page.getDoc(),"http://bbs.gter.net/thread.*");
            System.out.println(nextLinks+"\n");
            return nextLinks;
        }else{


            byte[] content=page.getContent();
            try {
                FileUtils.writeFileWithParent("/Users/gary/Dropbox/hooom/program/html"+id.incrementAndGet()+".txt", content);
                System.out.println("save page "+page.getUrl());
            } catch (IOException ex) {
                ex.printStackTrace();
            }
        }
        return null;
    }

RegexRule regexRule = new RegexRule();

{
    regexRule.addRule("http://bbs.gter.net/thread.*");
}

public Links visitAndGetNextLinks(Page page) {
    String url = page.getUrl();

    if (Pattern.matches("http://bbs.gter.net/forum-1033-.*", url)) {
        Links nextLinks=new Links();


        nextLinks.addAllFromDocument(page.getDoc(),regexRule);
        System.out.println(nextLinks+"\n");
        return nextLinks;
    }else{


        byte[] content=page.getContent();
        try {
            FileUtils.writeFileWithParent("/Users/gary/Dropbox/hooom/program/html"+id.incrementAndGet()+".txt", content);
            System.out.println("save page "+page.getUrl());
        } catch (IOException ex) {
            ex.printStackTrace();
        }
    }
    return null;
}