Machine learning 如何使用监督机器学习方法处理不同的输入维度?

Machine learning 如何使用监督机器学习方法处理不同的输入维度?,machine-learning,data-processing,lcs,supervised-learning,Machine Learning,Data Processing,Lcs,Supervised Learning,因此,基本上我处理的是长度不等的训练和测试数据集(一组数组),如下所示: a: {true, [1,3, 4, 5, 5, 8 ,10 ,10]} b: {true, [1,3, 25, 18 ,1 ,10]} c: {false, [1, 8 ,10]} d: {false, [1,3 ,10 ,10]} 我是机器学习领域的新手,我对如何使这些非等长的输入数组变为等长的问题很感兴趣,因此可以轻松地利用现有的机器学习算法 目前我可以考虑使用最大公共序列来查找不同长度的输入数组之间的相似性 但

因此,基本上我处理的是长度不等的训练和测试数据集(一组数组),如下所示:

a: {true, [1,3, 4, 5, 5, 8 ,10 ,10]}
b: {true, [1,3, 25, 18 ,1 ,10]}
c: {false, [1, 8 ,10]}
d: {false, [1,3  ,10 ,10]}
我是机器学习领域的新手,我对如何使这些非等长的输入数组变为等长的问题很感兴趣,因此可以轻松地利用现有的机器学习算法

目前我可以考虑使用最大公共序列来查找不同长度的输入数组之间的相似性

但基本上,在我得到LCS信息后,我如何将输入数组转换为等长数组


我走对了吗?有谁能给我一些帮助吗?

这类任务没有通用的解决方案。一切都取决于您的数据实际所代表的内容。有几十种特征提取技术可以很好地处理不同长度的数据,但具体的选择取决于特定的任务。没有,也不可能有一种通用的方法使变长表示法成为等长表示法。LCS似乎是一种非常奇怪的方法,它应该给出非常错误的结果(至少在一般情况下,可能在这个特定问题中它有意义)。如果是这种情况(LCS确实有意义),则它将返回新表示的一维。这只是新向量的一个特性。要应用任何合理的机器学习技术,还需要更多。

大多数ML算法需要固定的输入和输出。 完全卷积神经网络或递归神经网络可以处理不同的输入和输出

但在您的情况下,我建议只grt最大数组长度,并将零附加到项目少于最大值的数组中