Machine learning 处理与分类变量相关的某些问题

Machine learning 处理与分类变量相关的某些问题,machine-learning,Machine Learning,假设你有一列(在众多分类变量中)可以区分特定产品中的脂肪类型。。(即低脂、无脂、全脂~3个独特的字符串) 我需要使用一个热编码将这些唯一的“值”(字符串)转换成二进制编码 但是,就这3个字符串中的一个(比如说低脂)而言,似乎无论是谁输入数据,都是以LF或低脂或干脆低脂的形式输入的,至少我认为,这三个字符串都被一个热编码器类onehotcoder()认为是唯一的字符串 那么,如何对这些字符串进行“预处理”,使其只包含原始的3个独特字符串(低脂、无脂、全脂),而不包含其他内容呢

假设你有一列(在众多分类变量中)可以区分特定产品中的脂肪类型。。(即低脂、无脂、全脂~3个独特的字符串)

我需要使用一个热编码将这些唯一的“值”(字符串)转换成二进制编码

但是,就这3个字符串中的一个(比如说低脂)而言,似乎无论是谁输入数据,都是以LF低脂或干脆低脂的形式输入的,至少我认为,这三个字符串都被一个热编码器类
onehotcoder()
认为是唯一的字符串

那么,如何对这些字符串进行“预处理”,使其只包含原始的3个独特字符串(低脂、无脂、全脂),而不包含其他内容呢