Pentaho-CSV输入不理解特殊字符[Windows到Linux]

Pentaho-CSV输入不理解特殊字符[Windows到Linux],linux,pentaho,transformation,business-intelligence,pdi,Linux,Pentaho,Transformation,Business Intelligence,Pdi,我对Pentaho数据集成进行了一次转换,我要做的第一件事是使用“CSV输入”映射平面文件 我在windows上从来没有遇到过这个问题,但现在我改变了我的服务器,spoon将运行到linux服务器,现在我遇到了特殊字符的问题 我注意到的第一件事是我的表被更新了,因为系统将这些名称理解为与数据库中的名称不同的字符串 检查问题时,我还注意到,如果我转到“CSV输入”->Preview,它将向我显示存在上述问题的数据预览: 应在哪里: Diretoria de Suporte à Decisão e

我对Pentaho数据集成进行了一次转换,我要做的第一件事是使用“CSV输入”映射平面文件

我在windows上从来没有遇到过这个问题,但现在我改变了我的服务器,spoon将运行到linux服务器,现在我遇到了特殊字符的问题

我注意到的第一件事是我的表被更新了,因为系统将这些名称理解为与数据库中的名称不同的字符串

检查问题时,我还注意到,如果我转到“CSV输入”->Preview,它将向我显示存在上述问题的数据预览:

应在哪里:

Diretoria de Suporte à Decisão e Aplicação
我使用命令检查了我的文件字符集/编码,结果显示:

$ file -bi foo.csv
text/plain; charset=iso-8859-1
如果我在vi上打开foo.csv,它就会理解特殊字符


你知道问题出在哪里吗?或者我应该尝试什么?

我没有任何使用这种编码的数据文件,所以你必须做一些实验,但是有一些步骤是专门用来解决这些问题的

首先,
CSV输入
步骤有一个字段,允许您选择源文件的编码。
文本文件输入
步骤在“内容”选项卡下有“格式”(表示行终止符)和“编码”选择器

在转换中,在实用程序选项卡下有
更改文件编码
步骤。此步骤旨在复制多个文件,同时更改其编码;这就是为什么它处于转换中

在作业中,在“文件管理”选项卡下有“在Windows和Unix之间转换文件”步骤,但这似乎只处理行终止符

无论哪种方式,如果CSV/文本文件输入步骤不适合您的需要,您都必须先将文件复制到新的编码,然后再将其读入。首先尝试使用文件输入步骤来处理它可能是最简单的。

我将CSV输入的“文件编码”字段更改为ISO-8859-1,这对我很有效。非常感谢你。