如何使用python获取行数？_Python_Pandas

如何使用python获取行数？

python pandas

如何使用python获取行数？,python,pandas,Python,Pandas,我有以下数据结构 ID Number Product_Description 45452 MSSQL 45453 INFORMATICA 45454 INFORMATICA 45458 INFORMATICA 45456 MSSQL 45457 DBA 输出应该是 MSSQL 2 INFORMATICA 3 DBA 1 我想将其存储在一个列表中： v_1 = [MSSQL,INFOR

我有以下数据结构

ID Number   Product_Description
45452       MSSQL
45453       INFORMATICA
45454       INFORMATICA
45458       INFORMATICA
45456       MSSQL
45457       DBA

输出应该是

MSSQL        2
INFORMATICA  3
DBA          1

我想将其存储在一个列表中：

v_1 = [MSSQL,INFORMATICA,DBA]
v_2 = [2,3,1]

如果顺序很重要，则与排序=False一起使用：

s = df.groupby('Product_Description', sort=False).size()
print (s)
Product_Description
MSSQL          2
INFORMATICA    3
DBA            1
dtype: int64

v_1 = s.index.tolist()
v_2 = s.values.tolist()

print (v_1)
['MSSQL', 'INFORMATICA', 'DBA']
print (v_2)
[2, 3, 1]

如果订单应不同，例如按发生次数排序：

s = df['Product_Description'].value_counts()
print (s)
INFORMATICA    3
MSSQL          2
DBA            1
Name: Product_Description, dtype: int64

v_1 = s.index.tolist()
v_2 = s.values.tolist()

print (v_1)
['INFORMATICA', 'MSSQL', 'DBA']

print (v_2)
[3, 2, 1]

另一个解决方案是创建列表字典：

df1 = df.groupby('Product_Description', sort=False).size().reset_index()
df1.columns=['v_1','v_2']
print (df1)
           v_1  v_2
0        MSSQL    2
1  INFORMATICA    3
2          DBA    1

d = df1.to_dict(orient='list')
print (d)
{'v_1': ['MSSQL', 'INFORMATICA', 'DBA'], 'v_2': [2, 3, 1]}

print (d['v_1'])
['MSSQL', 'INFORMATICA', 'DBA']

print (d['v_2'])
[2, 3, 1]

如果顺序很重要，则与排序=False一起使用：

s = df.groupby('Product_Description', sort=False).size()
print (s)
Product_Description
MSSQL          2
INFORMATICA    3
DBA            1
dtype: int64

v_1 = s.index.tolist()
v_2 = s.values.tolist()

print (v_1)
['MSSQL', 'INFORMATICA', 'DBA']
print (v_2)
[2, 3, 1]

如果订单应不同，例如按发生次数排序：

s = df['Product_Description'].value_counts()
print (s)
INFORMATICA    3
MSSQL          2
DBA            1
Name: Product_Description, dtype: int64

v_1 = s.index.tolist()
v_2 = s.values.tolist()

print (v_1)
['INFORMATICA', 'MSSQL', 'DBA']

print (v_2)
[3, 2, 1]

另一个解决方案是创建列表字典：

df1 = df.groupby('Product_Description', sort=False).size().reset_index()
df1.columns=['v_1','v_2']
print (df1)
           v_1  v_2
0        MSSQL    2
1  INFORMATICA    3
2          DBA    1

d = df1.to_dict(orient='list')
print (d)
{'v_1': ['MSSQL', 'INFORMATICA', 'DBA'], 'v_2': [2, 3, 1]}

print (d['v_1'])
['MSSQL', 'INFORMATICA', 'DBA']

print (d['v_2'])
[2, 3, 1]

您可以使用值\单位计数

p=df['Product_Description'].value_counts()
V_1=p.index.tolist()
V_2=p.values.tolist()

您可以使用值\单位计数

p=df['Product_Description'].value_counts()
V_1=p.index.tolist()
V_2=p.values.tolist()

请使用格式化工具更新您的问题。如果你表现出你的努力，你会得到更好的帮助；StackOverflow不是一个代码编写论坛。请展示您的工作。@user8195447您能添加上面的数据结构类型吗？我很确定它们是

熊猫系列（pd.series
）对象，其中ID Number
是索引。name
？请使用格式化工具更新您的问题。如果你表现出你的努力，你会得到更好的帮助；StackOverflow不是一个代码编写论坛。请展示您的工作。@user8195447您能添加上面的数据结构类型吗？我很确定它们是pandas
series
（pd.series
）对象，其中ID Number
是索引。name
？请告诉我。这是最好的选择。非常感谢先生！比我快。这是最好的选择。非常感谢先生@用户8195447-如果我的答案或其他答案有帮助，请不要忘记它-单击答案旁边的复选标记，将其从灰色变为填充。谢谢。@user8195447-如果我的答案或其他答案有帮助，请不要忘记它-单击答案旁边的复选标记，将其从灰色变为填充。谢谢