Python 在Colab中查看数据帧时遇到问题

Python 在Colab中查看数据帧时遇到问题,python,pandas,Python,Pandas,我试图将sklearn数据集视为Colab笔记本中的熊猫数据帧 通过别人的建议,我找到了命令 %load_ext google.colab.data_table 非常有用。例如,以下代码用于加载和查看众所周知的葡萄酒数据集 import pandas as pd %load_ext google.colab.data_table from sklearn.datasets import load_wine data = load_wine() df = pd.DataFrame(data['d

我试图将sklearn数据集视为Colab笔记本中的熊猫数据帧

通过别人的建议,我找到了命令

%load_ext google.colab.data_table
非常有用。例如,以下代码用于加载和查看众所周知的葡萄酒数据集

import pandas as pd
%load_ext google.colab.data_table
from sklearn.datasets import load_wine
data = load_wine()
df = pd.DataFrame(data['data'], columns=data['feature_names'])
df['target'] = data['target']
df
在“结果”单元格中,我可以选择希望在一页上查看多少行。它非常适合在数据中导航

然后我用威斯康星州的乳腺癌数据做了同样的尝试:

import pandas as pd
%load_ext google.colab.data_table
from sklearn.datasets import load_breast_cancer
data = load_breast_cancer()
df = pd.DataFrame(data['data'], columns=data['feature_names'])
df['target'] = data['target']
df
现在,没有这样的选项来选择我希望在一个页面上查看多少行


我很想知道不同的结果是否与特定sklearn数据集中的任何不同格式有关。

您可以使用熊猫数据帧的.headn方法指定colab或任何其他shell/IDE中显示的行数,其中n是您希望显示的行数。要查看所有显示的行,请将“display.max_rows”设置为无。下面 显示乳腺癌数据集中的前40行

import pandas as pd
from sklearn.datasets import load_breast_cancer

pandas.set_option('display.max_rows', None)   

data = load_breast_cancer()
df = pd.DataFrame(data['data'], columns=data['feature_names'])
df['target'] = data['target']
df.head(40)

虽然乳腺癌数据集没有“每页交互式下拉显示”选项卡,但这应该足以让您在数据框中查看所需的所有行。

您使用的是jupyter吗?不,它在Google Colab笔记本中。虽然我在自己的工作中使用了Jupyter,但这是用于线性代数课程的教学目的。您知道如何使数据在每列中居中显示吗?请查看此线程。只需将“right”更改为“center”