Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/379.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
HTML中的微数据Java解析器_Java_Parsing_Metadata_Microdata - Fatal编程技术网

HTML中的微数据Java解析器

HTML中的微数据Java解析器,java,parsing,metadata,microdata,Java,Parsing,Metadata,Microdata,实际上,我正在尝试使用java库解析HTML源页面中的schema.org微数据。我尝试了许多站点,最后从For.apache any23中找到了any23和Mf2j。我没有找到合适的文档,所以我留下了它们,最后使用Mf2j构建了项目,并获得了jar。我创建了一个示例项目来执行Mf2j来解析微数据。下面是我编写的示例代码 package org.mypro; import java.io.IOException; import java.net.HttpURLConnection; impor

实际上,我正在尝试使用java库解析HTML源页面中的schema.org微数据。我尝试了许多站点,最后从For.apache any23中找到了any23和Mf2j。我没有找到合适的文档,所以我留下了它们,最后使用Mf2j构建了项目,并获得了jar。我创建了一个示例项目来执行Mf2j来解析微数据。下面是我编写的示例代码

package org.mypro;

import java.io.IOException;
import java.net.HttpURLConnection;
import java.net.URI;
import java.net.URISyntaxException;
import java.net.URL;
import java.util.Map;
import java.util.Properties;
import java.util.Map.Entry;

import com.kylewm.mf2j.Mf2Parser;

public class MySample {

    /**
     * @param args
     * @throws URISyntaxException 
     * @throws IOException 
     */
    public static void main(String[] args) throws IOException, URISyntaxException {
        // TODO Auto-generated method stub
        Mf2Parser parser = new Mf2Parser()
        .setIncludeAlternates(true)
        .setIncludeRelUrls(true);
        URL server = new URL("http://blogbasics.com/examples-of-blogs/");
        Properties systemProperties = System.getProperties();
        systemProperties.setProperty("http.proxyHost","pp.xyz.com");
        systemProperties.setProperty("http.proxyPort","1234");
        HttpURLConnection connection = (HttpURLConnection)server.openConnection();
        connection.connect();
    Map<String,Object> parsed = parser.parse(new URI("http://blogbasics.com/examples-of-blogs/"));
    for (Entry<String, Object> string : parsed.entrySet()) {
        System.out.println(string.getKey() +" = "+string.getValue());
    }

    }

}
实际上,我需要这种形式的输出,而不是json格式。我需要这样的数据内容。我是使用来自的JavaScript微数据解析器发现这一点的,但我需要java中相同类型的解析器。请推荐我。谢谢

“类型”:[“http://schema.org/WebPage“],“属性”:{“mainContentOfPage”:[{”类型:[”http://schema.org/Blog“],“属性”:{“blogPost”:[{”类型:[”http://schema.org/BlogPosting“],“属性”:{“标题”:[“博客示例”],“作者”:[{“类型”:[”http://schema.org/Person“],“属性”:{“名称”:[“Kenneth Byrd” ] } } ],
阅读更多:http://foolip.org/microdatajs/live/#ixzz3lJJII7g0 

你的代码显示了你公司的一些内部代理设置,下次请保持警惕。谢谢你的通知。我更改了它。你是否尝试过模拟
CHROME
?没有。我没有尝试过。你是在让我尝试微数据解析吗?你的代码显示了你公司的一些内部代理设置,下次请保持警惕。谢谢你的通知。我改了。你试过模拟CHROME吗?没有。我没有试过。你是想让我试一下微数据解析吗?