Neural network 使用word2vec表示哈希值是否有意义?

Neural network 使用word2vec表示哈希值是否有意义?,neural-network,word2vec,Neural Network,Word2vec,我有一个包含数据包序列长度不确定的执行路径。例如,/A/B/C/D/E、/A/E/G/B等,其中大写字符是由哈希值表示的数据包。如果我使用word2vec表示每个数据包是否有意义?word2vec依赖预测性共现来实现其有用的密集嵌入表示 如果您使用的是强散列,它将数据包中的一个位的差异转换为一个完全不同的令牌,那么这可能对Word2Vec没有帮助 如果它是某种语义散列,用于为相似的数据包提供相似的令牌,那么它可能对Word2Vec算法是合适的,并且是有帮助的 当您提到您的最终目标是“预测此路径是

我有一个包含数据包序列长度不确定的执行路径。例如,/A/B/C/D/E、/A/E/G/B等,其中大写字符是由哈希值表示的数据包。如果我使用word2vec表示每个数据包是否有意义?

word2vec依赖预测性共现来实现其有用的密集嵌入表示

如果您使用的是强散列,它将数据包中的一个位的差异转换为一个完全不同的令牌,那么这可能对Word2Vec没有帮助

如果它是某种语义散列,用于为相似的数据包提供相似的令牌,那么它可能对Word2Vec算法是合适的,并且是有帮助的


当您提到您的最终目标是“预测此路径是否会导致错误的系统全局状态”时,我想知道Word2Vec word vectors是否是合适的工具。Word2Vec在其模型中没有太多的深度/重复性/系列状态性;它不太可能获取关于底层“状态机”或“非法状态”的大量知识,尽管它可能有助于根据类似的前置/后继数据包将“数据包”定位为与其他数据包相似的数据包(作为其他更有状态分析的有用信息源)

我想它的意义取决于你的目的。还有,你已经有矢量表示了吗?如果没有,您将从何处生成它们?@kubuntu我使用散列值来标识数据包。数据包组成执行路径,记录系统的全局状态是否出错。在路径中,数据包不会重复出现。但是路径的长度和数据包的顺序各不相同。我的最终目的是,给定一段新路径,从起点开始,但不一定在终点结束,预测该路径是否会导致错误的系统全局状态。