使用Pentaho计算缺失值的数目

使用Pentaho计算缺失值的数目,pentaho,transformation,missing-data,Pentaho,Transformation,Missing Data,我是Pentaho的新手,我正在尝试一项非常简单的任务(我想),但我没有成功。我有一个CSV文件,其中包含多个列和行。我想计算每行中缺少的值的数量。我试图这样做: 我尝试使用“分组方式”框,但我真的不知道它是否合适。 你能给我一些提示或者给我一个合适的方框来解决我的问题吗 第一张图片是文件中某行的示例(包含69列和250万行),第二张图片是预期结果(每行的空值数)可能还有其他方法可以做到这一点,但是可以使用修改的Java脚本步骤来做到这一点。类似的内容将计算null的数量 var field

我是Pentaho的新手,我正在尝试一项非常简单的任务(我想),但我没有成功。我有一个CSV文件,其中包含多个列和行。我想计算每行中缺少的值的数量。我试图这样做:

我尝试使用“分组方式”框,但我真的不知道它是否合适。 你能给我一些提示或者给我一个合适的方框来解决我的问题吗


第一张图片是文件中某行的示例(包含69列和250万行),第二张图片是预期结果(每行的空值数)

可能还有其他方法可以做到这一点,但是可以使用
修改的Java脚本步骤来做到这一点。类似的内容将计算
null
的数量

var fields = getInputRowMeta().getFieldNames();

var nulls = 0;
for (var i = 0; i < fields.length; i++) {
    if (row[i] == null) {
        nulls += 1;
    }
}
var fields=getInputRowMeta().getFieldNames();
var nulls=0;
对于(变量i=0;i

然后将
nulls
值输出到步骤中的行。

您可以发布一些具有预期输出的CSV行吗?我添加输入文件和预期结果的图片是否足够?我仍然不确定第一行的数字是1。在那个例子中它算什么?这是以
0
作为值的列数?这是一个示例,假设计算空白单元格“”的数量,其中没有任何内容。从屏幕截图来看,屏幕上只有第一行数据缺少4个值,但在示例输出中,您说1。我尝试启动我得到的脚本“ReferenceError:“getInputRowMeta”未定义。“作为一个错误。我应该插入类似于库的内容吗?您使用的是什么版本?您可以测试此转换是否适用于您吗:据我所知,不是。您为什么需要逐列进行转换?您应该能够通过
getInputRowMeta()轻松实现这一点。”
。是否要计算一列的空值数?然后将每列的空值数相加?在您的问题中不是这样的。