Python 如何将一系列分类特征作为机器学习模型的输入?

Python 如何将一系列分类特征作为机器学习模型的输入?,python,arrays,machine-learning,tensorflow,categorical-data,Python,Arrays,Machine Learning,Tensorflow,Categorical Data,假设我的训练数据集中的每个训练示例都有一个数组,这个数组的大小不同,包含一个描述特定示例的单词标记/类别。对于不同的培训示例,此数组中的一些值示例如下: ["cat", "animal", "meow", "dark] ["stationary", "pen", "drawing"] 在tensorflow中,处理这些类别数组的方法是什么?这些类别数组的每个输入都有不同的大小,以使它们成为模型的特征?我就是不知道该怎么做,也不知道我是不是想得太多了。我可以对每个数组的每个条目进行一次热编码,这

假设我的训练数据集中的每个训练示例都有一个数组,这个数组的大小不同,包含一个描述特定示例的单词标记/类别。对于不同的培训示例,此数组中的一些值示例如下:

["cat", "animal", "meow", "dark]
["stationary", "pen", "drawing"]

在tensorflow中,处理这些类别数组的方法是什么?这些类别数组的每个输入都有不同的大小,以使它们成为模型的特征?我就是不知道该怎么做,也不知道我是不是想得太多了。我可以对每个数组的每个条目进行一次热编码,这样每个数组都可以变成一个数组数组,所有数组都可以有不同的长度吗?还有比这更好的方法吗?我已经在这个问题上纠缠了很长一段时间,没有取得多大进展。

我不知道tensorflow,但可能有一个简单的例子说明您在文档中试图做什么。我看了很多,但在他们的文档中找不到任何与我的问题类似的东西一种热编码方法很好。这样你们就有了稀疏矩阵,但它可以适应不同的数组长度问题。不要被卡住,继续,训练一个模型,看看结果。