String 如何将一系列符号编码为数字形式而不丢失信息?

String 如何将一系列符号编码为数字形式而不丢失信息?,string,encoding,neural-network,feature-extraction,String,Encoding,Neural Network,Feature Extraction,我想用神经网络对字符串进行分类。问题是神经网络接受数字输入,所以我需要一种将字符串编码成数字向量的方法。有没有一个标准的方法来解决这样的问题 我在考虑计算n克,但如果我不想丢失任何信息,这种方法将导致巨大的特征向量,因为我需要计算从1克到字符串克长度的所有信息。对吧? 那么,有没有更紧凑的方法将字符串编码为数字数据?维护符号频率及其顺序信息的工具?这可能就是您要搜索的工具吗? 您可以使用word2vec对单词(可能还有符号)进行向量化,然后添加向量(或在遇到否定时减去向量),然后将结果除以添加

我想用神经网络对字符串进行分类。问题是神经网络接受数字输入,所以我需要一种将字符串编码成数字向量的方法。有没有一个标准的方法来解决这样的问题

我在考虑计算n克,但如果我不想丢失任何信息,这种方法将导致巨大的特征向量,因为我需要计算从1克到字符串克长度的所有信息。对吧?


那么,有没有更紧凑的方法将字符串编码为数字数据?维护符号频率及其顺序信息的工具?

这可能就是您要搜索的工具吗?

您可以使用word2vec对单词(可能还有符号)进行向量化,然后添加向量(或在遇到否定时减去向量),然后将结果除以添加到“构建字符串”中的单词数,以执行某种向量化的平均值来缩小该值。我还没有测试过这个工具


您还问了一个关于字符串中单词的频率和顺序的问题。我认为这种技术可能会冲走订单,但不会冲走它们的数量

你想用哪个符号对它们进行分类?@Yurazaletsky分类标准本身不是字符串的属性。每个字符串代表一个进程,应根据进程是否成功进行分类