Python 3.x 替换由整数、浮点数和分类字符串组成的单个列中的字符串(类别)-熊猫

Python 3.x 替换由整数、浮点数和分类字符串组成的单个列中的字符串(类别)-熊猫,python-3.x,pandas,data-science,Python 3.x,Pandas,Data Science,我有一个Pandas列,其中大部分包含整数、一点浮点和一些字符串,如“yes”、“no”和一些其他字符串。我可以用什么替换这些字符串?由于该列不是完全分类的,所以我不能进行一般的热编码或类似的编码。在这种情况下,最佳做法是什么 更新: 由于某些原因,此列的外观并不明显,因此下面是一个示例: column_name 1000 45 3.0 yes no 340.0 p k 4 . . . 数

我有一个Pandas列,其中大部分包含整数、一点浮点和一些字符串,如“yes”、“no”和一些其他字符串。我可以用什么替换这些字符串?由于该列不是完全分类的,所以我不能进行一般的热编码或类似的编码。在这种情况下,最佳做法是什么

更新: 由于某些原因,此列的外观并不明显,因此下面是一个示例:

column_name
   1000
    45
    3.0
    yes
    no
    340.0
     p
     k
     4
     .
     .
     .

数据是完全合成的,我唯一需要知道的是,在列中处理此类字符串的最佳实践是什么。

要映射分类数据,需要使用

例如:

import pandas as pd
df = pd.DataFrame({'A':[1,2,3,4], 'B': ['a', 'b', 'c', 'd'], 'C': [1,'e', 'f', 3]})

# all strings:
pd.get_dummies(df['B'])

    a   b   c   d
0   1   0   0   0
1   0   1   0   0
2   0   0   1   0
3   0   0   0   1

# mixed types:
pd.get_dummies(df['C'])


    1   3   e   f
0   1   0   0   0
1   0   0   1   0
2   0   0   0   1
3   0   1   0   0

如果你能提供更多的上下文,这将是很有帮助的!你想干什么?这是什么样的数据?你能提供一个数据的示例/视图吗?这个问题再简单不过了,但我添加了一个更新。你想用这个实现什么?如果你愿意,你可以将字符串转换成数字,如果这有意义的话,比如“是”可以是1,“否”可以是0,但显然这不是一个熊猫问题,而是一个数据问题:字符串意味着什么?你想对输出做什么?如果你说的是NLP类型的东西,那么你需要用Word2Vec之类的东西把字符串编码成向量。对于简单的字符串映射,如“是/否”,二进制映射1/0听起来非常好。对于其他字符串,如果没有它们的含义的上下文,很难提供帮助。我提出的
get_dummies
函数是一种通用方法,用于将分类数据转换为ML类型任务的数字。是的,当列仅是分类的,但当它具有混合整数和字符串值时不是?如果我想在字符串上获取虚拟对象,我不知道该如何做,或者是否可能。请仅在该列上获取虚拟对象。合并到您的df中,并删除原始的colimn,但在这种情况下,所有的数字也将转换为假人?我不希望转换数字,只希望转换字符串。如果在同一列中有数字和字符串,则该列中的数字也是字符串。数据类型用于整个列。如果有带stting的列和带数字的列,请仅对字符串列应用get\u假人。这意味着在这种情况下我不能使用get\u假人,因为整个列都是object。我应该用不同的数字手动替换字符串,还是在这种情况下我还能做些什么?