Python Scipy Stats.description和Pandas
我正在探索college.csv数据集,并获取每个列的描述性统计数据,如果我删除这两个分类列,它就会起作用Python Scipy Stats.description和Pandas,python,numpy,scipy,Python,Numpy,Scipy,我正在探索college.csv数据集,并获取每个列的描述性统计数据,如果我删除这两个分类列,它就会起作用 college = pd.read_csv("C:/Users/Temple/ISLR_Datasets/College.csv") from scipy import stats college = college.drop("Unnamed: 0", 1) college = college.drop("Private", 1) for col in college.columns:
college = pd.read_csv("C:/Users/Temple/ISLR_Datasets/College.csv")
from scipy import stats
college = college.drop("Unnamed: 0", 1)
college = college.drop("Private", 1)
for col in college.columns:
desc[col] = stats.describe(college[col])
但是,如果我试图忽略列并保持数据集不变,它会抛出一个操作数类型错误:
for col in college.columns:
if(col!="Unnamed: 0" or col!="Private"):
desc[col] = stats.describe(college[col])
unsupported operand type(s) for /: 'str' and 'int'
你知道熊猫和numpy有什么不同吗?问题在于
如果条件,它不能忽略列“Unnamed:0”
和“Private”
,它总是正确的。stats.description(college[col])
将应用于列“Unnamed:0”和列“Private”
。您可以使用不在字符串列表中
来过滤它们:
if col not in ["Unnamed: 0","Private"]
什么是College.csv
数据集?引发异常时,col
的确切含义是什么?报告Python错误时,始终包括完整的回溯(即完整的错误消息)。它将显示实际引发异常的行。(在这种情况下,我怀疑这是在调用stats.description(college[col])
中)谢谢,只是一个简单的疏忽!