R 数字数据帧上的强制错误引入NAs

R 数字数据帧上的强制错误引入NAs,r,euclidean-distance,R,Euclidean Distance,我正在尝试对数据帧进行群集,但当我运行dist函数时,出现错误“强制引入NAs” 起初我认为如果是因为我的DF包含因子向量,如下所示: 但我随后用数字值创建了一个新的DF,并显示了相同的错误消息: 所以我不确定为什么我会收到这个错误信息,我没有看到的是什么?因子数据上的欧几里德距离是胡说八道 难怪它不起作用 尽管如果将数据编码为数字,错误会消失,但结果仍然是无意义的。您能提供一个简单的解决方案吗?我强烈建议以文本形式而不是png形式给出代码。当然,我正在运行以下命令:codedistanc

我正在尝试对数据帧进行群集,但当我运行dist函数时,出现错误“强制引入NAs”

起初我认为如果是因为我的DF包含因子向量,如下所示:

但我随后用数字值创建了一个新的DF,并显示了相同的错误消息:


所以我不确定为什么我会收到这个错误信息,我没有看到的是什么?

因子数据上的欧几里德距离是胡说八道

难怪它不起作用


尽管如果将数据编码为数字,错误会消失,但结果仍然是无意义的。

您能提供一个简单的解决方案吗?我强烈建议以文本形式而不是png形式给出代码。当然,我正在运行以下命令:
code
distance=dist(imputedTrainOquestions[,2:5],method=“euclidean”)
code
在我的dafa框架上,该框架只包含数值,没有NAsI意味着提供真正可复制的代码。如果其他人运行
distance=dist(imputedTrainNoQuestions[,2:5],method=“euclidean”)
,他们将得到一个错误,因为
imputedTrainNoQuestions
不在他们的工作区中。你能运行
dput(imputedTrainNoQuestions[sample(1:5568,size=50),])
并发布结果als文本(不是png!)吗?我消除了错误,我的代码中有一个错误,使用欧几里德距离进行聚类,我的模型工作正常。它可以运行,但结果没有统计意义!小心!如果我正在使用对一个数据集进行聚类,然后对其进行逻辑回归,为什么不这样做呢?大多数向量都是yes-no响应即使是二进制数据,聚类通常也是毫无意义的。有“是/否”的“频繁组合”,但常规聚类算法无法找到这些组合。看看这里关于二进制数据的所有问题——它“不只是工作”。仔细研究结果,注意那些没有意义的东西(不要只是试图“解释”它们——你会看到一些不存在的东西)。