Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/310.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 从其他语言网站获取UTF-8字符_Java_Jar_Web Scraping - Fatal编程技术网

Java 从其他语言网站获取UTF-8字符

Java 从其他语言网站获取UTF-8字符,java,jar,web-scraping,Java,Jar,Web Scraping,我正在尝试从一个匈牙利语网站获取数据。该站点还具有一些UTF-8字符,即ő。所以当我从网站上删除数据时,它会将特殊字符变成一些未知字符。我需要用同样的匈牙利语获取数据。 现在我正在使用gargoylesoftware.htmlunit jar文件来废弃数据。 请告诉我如何通过使用任何特定的方法来实现这一点,或者我是否需要一些其他jar文件? 这是我正在使用的一段代码 HtmlElement doctorInstitutionTitlePhone = page.getFirstByXPath(

我正在尝试从一个匈牙利语网站获取数据。该站点还具有一些UTF-8字符,即ő。所以当我从网站上删除数据时,它会将特殊字符变成一些未知字符。我需要用同样的匈牙利语获取数据。 现在我正在使用gargoylesoftware.htmlunit jar文件来废弃数据。 请告诉我如何通过使用任何特定的方法来实现这一点,或者我是否需要一些其他jar文件? 这是我正在使用的一段代码

 HtmlElement doctorInstitutionTitlePhone =  page.getFirstByXPath(".//*[@id='orvosok_kartyajinak_helye']/table/tbody/tr[2]/td[1]/div[3]");
 String sDITP = doctorInstitutionTitlePhone.asText();

没有“UTF-8字符”这样的东西-有一个用UTF-8编码的Unicode字符,但这个网站可能使用了不同的编码。你知道它使用什么编码吗?你能展示一下你用来获取内容的代码吗?有多种方法,有些自动为您执行字符集“解码”,有些则不执行。您确定站点实际发送的是使用UTF-8编码的数据吗?
内容类型
标题是什么?@JonSkeet我怎么知道这个网站使用的是什么编码?如果你愿意,我可以给你网站的url。@fge我不太明白,但我想你还是在问这个问题。