Ruby编码:为什么日语文本不能像铲运机一样读取?

Ruby编码:为什么日语文本不能像铲运机一样读取?,ruby,character-encoding,Ruby,Character Encoding,实际HTML scraper无法按原样解释日语的原因是什么?您可以添加params\u hash如下的content\u type属性: content\u type:“text/html;charset=UTF-8”您能告诉我们获取该页面所使用的代码吗?添加了示例ruby代码段。尝试puts response.body.encode('UTF-8','Shift\u-JIS')–似乎rest客户端无法自动确定页面的编码。puts response.body.encode('UTF-8','Sh

实际HTML


scraper无法按原样解释日语的原因是什么?

您可以添加
params\u hash
如下的
content\u type
属性:


content\u type:“text/html;charset=UTF-8”

您能告诉我们获取该页面所使用的代码吗?添加了示例ruby代码段。尝试
puts response.body.encode('UTF-8','Shift\u-JIS')
–似乎rest客户端无法自动确定页面的编码。
puts response.body.encode('UTF-8','Shift\u-JIS'))
正在工作。其他语言呢?像中文、韩文……等等?默认的
将response.body.encoding#
<HTML><HEAD>
<TITLE>綜合ユニコム株式会社</TITLE>
<a href=http://www.sogo-unicom.co.jp/index.html>綜合ユニコム株式会社</a>

</HTML>
 <HTML><HEAD>
<TITLE>�������j�R����������</TITLE>
</HEAD>
<a href=http://www.sogo-unicom.co.jp/index.html>�������j�R����������</a></font></td>
</HTML>
 require 'rest-client'
 params_hash = {
          method: :get,
          url: 'http://sogo-uni.com/',
        }

response = RestClient::Request.execute(params_hash)
puts response.body