创建python表
我在excel中有一个数据集。下面给出了一个数据示例。每行包含若干项;每列一项。数据也没有标题创建python表,python,pandas,Python,Pandas,我在excel中有一个数据集。下面给出了一个数据示例。每行包含若干项;每列一项。数据也没有标题 a b a d g z f d a e dd gg dd g f r t 想要创建一个如下所示的表。它应该对每行中的项目进行计数,并按行显示计数。我不知道桌子上有多少东西 row# a b d g z f e dd gg r t 1 2 1 1 0 0 0 0 0 0 0 0 2 1 0 1 1 1 1 0 0 0 0 0 3 0 0 0 0 0 0 1 0 0 0 0 4 0 0 0
a b a d
g z f d a
e
dd gg dd g f r t
想要创建一个如下所示的表。它应该对每行中的项目进行计数,并按行显示计数。我不知道桌子上有多少东西
row# a b d g z f e dd gg r t
1 2 1 1 0 0 0 0 0 0 0 0
2 1 0 1 1 1 1 0 0 0 0 0
3 0 0 0 0 0 0 1 0 0 0 0
4 0 0 0 1 0 1 0 2 1 1 1
我不是python方面的专家,非常感谢您的帮助 使用
get_dummies
+sum
:
df = pd.read_csv(file, names=range(100)).stack() # setup to account for missing values
df.str.get_dummies().sum(level=0)
a b d dd e f g gg r t z
0 2 1 1 0 0 0 0 0 0 0 0
1 1 0 1 0 0 1 1 0 0 0 1
2 0 0 0 0 1 0 0 0 0 0 0
3 0 0 0 2 0 1 1 1 1 1 0
谢谢你的回复。不幸的是,代码给了我一个错误。错误如下:“AttributeError:'list'对象没有属性'stack'”。@M.Nair我缺少一个右括号。它应该抛出一个语法错误。检查我的编辑。@M.Nair如果有帮助,请随意接受答案(单击我答案旁边的灰色复选框将其变为绿色)。谢谢。