如何在Python中进行顺序(在线学习)一次热编码?

如何在Python中进行顺序(在线学习)一次热编码?,python,machine-learning,sequential,one-hot-encoding,Python,Machine Learning,Sequential,One Hot Encoding,我有一个数据库太大,无法进入内存,因此我不得不按顺序加载它。原始数据集有15个唯一值的分类变量,但在每个拼接中,我通常只得到10-11个唯一值,这在对数据帧进行热编码时会造成问题 我要找的是一个可以做到这一点的函数: 1) First go through my database sequentially logging all unique values 2) Then one-hot-encoding based on that 这是你的答案。这是你的答案。

我有一个数据库太大,无法进入内存,因此我不得不按顺序加载它。原始数据集有15个唯一值的分类变量,但在每个拼接中,我通常只得到10-11个唯一值,这在对数据帧进行热编码时会造成问题


我要找的是一个可以做到这一点的函数:

1) First go through my database sequentially logging all unique
values

2) Then one-hot-encoding based on that
这是你的答案。这是你的答案。