Neural network 如何以最佳方式为神经网络编码复杂数据?

Neural network 如何以最佳方式为神经网络编码复杂数据?,neural-network,bitvector,Neural Network,Bitvector,数据由几条记录组成。记录如下: [位向量、数值向量、一些数值]。 位向量对于每个记录具有不同的长度,对于数字向量也是如此。 每个记录的数值数量是所有记录的常量 输出为2个数字。它们的值(均在[0.0,1.0]范围内)用于搜索算法中的评估/适应度函数近似 所以,我的问题是: 如何为神经网络表示/规范化这些数据? 特别是,是否有一种(棘手的)方法来紧凑地表示位向量?它的长度可以达到几千个。除了一些经典问题外,没有单一正确的方法将复杂数据输入到神经网络中。这是一门艺术,事实上,深度学习的最新进展与表示

数据由几条记录组成。记录如下: [位向量、数值向量、一些数值]。 位向量对于每个记录具有不同的长度,对于数字向量也是如此。 每个记录的数值数量是所有记录的常量

输出为2个数字。它们的值(均在[0.0,1.0]范围内)用于搜索算法中的评估/适应度函数近似

所以,我的问题是: 如何为神经网络表示/规范化这些数据?
特别是,是否有一种(棘手的)方法来紧凑地表示位向量?它的长度可以达到几千个。

除了一些经典问题外,没有单一正确的方法将复杂数据输入到神经网络中。这是一门艺术,事实上,深度学习的最新进展与表示复杂数据的方法的进步有很大关系

因此,在不了解数据性质的情况下,很难给出任何具体建议。为什么有可变长度的向量?它们代表某种序列吗?位向量中编码的是什么

从纯技术的角度来看,可变长度数据意味着您需要使用零填充到恒定长度(最简单但通常不太好)或特殊的NN体系结构,如卷积或递归网络,选择将取决于数据集的性质。如果您的位向量表示一组某种二进制特征,那么每一位需要一个神经元,或者您可以尝试使用自动编码器训练紧凑的实值嵌入

为了得到更有用的答案,请描述问题的性质并将问题发布到