Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/304.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python pandas.DataFrame是如何转换为numpy.ndarray的_Python_Pandas_Numpy_Linear Regression - Fatal编程技术网

Python pandas.DataFrame是如何转换为numpy.ndarray的

Python pandas.DataFrame是如何转换为numpy.ndarray的,python,pandas,numpy,linear-regression,Python,Pandas,Numpy,Linear Regression,我是ML、熊猫和numpy的新手 我正在浏览一个线性回归程序的jupyter文件。我看到了 dataset=pd.read\u csv('C:\First ML Projects/winequality.csv') 当我执行type(dataset)时,我得到了pandas.core.frame.DataFrame。因为数据集是使用pd 然后就有这个代码, X=数据集[[‘固定酸度’、‘挥发性酸度’、‘柠檬酸’、‘残留糖’、‘氯化物’、‘游离二氧化硫’、‘总二氧化硫’、‘密度’、‘pH’、‘硫酸

我是ML、熊猫和numpy的新手

我正在浏览一个线性回归程序的jupyter文件。我看到了
dataset=pd.read\u csv('C:\First ML Projects/winequality.csv')

当我执行
type(dataset)
时,我得到了
pandas.core.frame.DataFrame
。因为数据集是使用
pd

然后就有这个代码,

X=数据集[[‘固定酸度’、‘挥发性酸度’、‘柠檬酸’、‘残留糖’、‘氯化物’、‘游离二氧化硫’、‘总二氧化硫’、‘密度’、‘pH’、‘硫酸盐’、‘酒精’]]。值

当我输入(X)时,我得到了
numpy.ndarray

第一个问题:
X
为什么不是
pandas.DataFrame
格式

第二:当没有提到numpy或np时,它是如何转换成
numpy.ndarray

第三:pandas.DataFrame和numpy.ndarray在存储数据时有什么区别

  • X=dataset[['fixed acidity',…,'alcohold']]
    意味着数据帧正在被列名称列表索引。结果仍然是一个数据帧,只包含选定的列。但随后该方法被应用于该数据帧。此方法返回基础NumPy数组
  • 熊猫是建立在NumPy之上的,所以如果数据框中有数字数据,它们将存储在引擎盖下的NumPy阵列中。同样,这个方法使这个问题在这里变得明确
  • NumPy阵列针对数值数据进行了优化,而Pandas则处理所有类型的数据。熊猫有更多的方式在数据帧中咀嚼数据,但通常比纯NumPy慢。A是二维的,行有索引,列有标签,而NumPy可以有任意数量的维度,但没有任何标签

  • 如果
    df
    是一个数据帧,那么
    df.values
    是一个numpy数组。
    Pandas构建在numpy
    之上,用于清除所有内容。我的印象是熊猫和小熊猫是两个不同的东西,因此很难理解小熊猫是从哪里冒出来的。谢谢你的回答。