Python pandas.DataFrame是如何转换为numpy.ndarray的
我是ML、熊猫和numpy的新手 我正在浏览一个线性回归程序的jupyter文件。我看到了Python pandas.DataFrame是如何转换为numpy.ndarray的,python,pandas,numpy,linear-regression,Python,Pandas,Numpy,Linear Regression,我是ML、熊猫和numpy的新手 我正在浏览一个线性回归程序的jupyter文件。我看到了 dataset=pd.read\u csv('C:\First ML Projects/winequality.csv') 当我执行type(dataset)时,我得到了pandas.core.frame.DataFrame。因为数据集是使用pd 然后就有这个代码, X=数据集[[‘固定酸度’、‘挥发性酸度’、‘柠檬酸’、‘残留糖’、‘氯化物’、‘游离二氧化硫’、‘总二氧化硫’、‘密度’、‘pH’、‘硫酸
dataset=pd.read\u csv('C:\First ML Projects/winequality.csv')
当我执行type(dataset)
时,我得到了pandas.core.frame.DataFrame
。因为数据集是使用pd
然后就有这个代码,
X=数据集[[‘固定酸度’、‘挥发性酸度’、‘柠檬酸’、‘残留糖’、‘氯化物’、‘游离二氧化硫’、‘总二氧化硫’、‘密度’、‘pH’、‘硫酸盐’、‘酒精’]]。值
当我输入(X)时,我得到了numpy.ndarray
第一个问题:X
为什么不是pandas.DataFrame
格式
第二:当没有提到numpy或np时,它是如何转换成numpy.ndarray
第三:pandas.DataFrame和numpy.ndarray在存储数据时有什么区别
X=dataset[['fixed acidity',…,'alcohold']]
意味着数据帧正在被列名称列表索引。结果仍然是一个数据帧,只包含选定的列。但随后该方法被应用于该数据帧。此方法返回基础NumPy数组如果
df
是一个数据帧,那么df.values
是一个numpy数组。Pandas构建在numpy
之上,用于清除所有内容。我的印象是熊猫和小熊猫是两个不同的东西,因此很难理解小熊猫是从哪里冒出来的。谢谢你的回答。