Python 循环来描述数据库表的内容_Python_Pandas

Python 循环来描述数据库表的内容

python pandas

Python 循环来描述数据库表的内容,python,pandas,Python,Pandas,我试图创建一个表模式的概述，并找到改进的地方 list_columns = reporting.columns.tolist() description = [] x = 0 for x in list_columns: description.append(reporting[x].describe()) x=x+1 这是我当前的方法-它失败了，因为description方法返回一些无法整理成列表或dict的内容感谢您的帮助。描述一张有熊猫的桌子如果使用pandas函数

我试图创建一个表模式的概述，并找到改进的地方

list_columns = reporting.columns.tolist()

description = []
x = 0
for x in list_columns:
    description.append(reporting[x].describe())
    x=x+1

这是我当前的方法-它失败了，因为description方法返回一些无法整理成列表或dict的内容

感谢您的帮助。

描述一张有熊猫的桌子如果使用pandas函数读取表（例如，此处有代码），则应获得一个dataframe作为输出，该dataframe定义了正确的列名和数据类型

然后，您可以通过简单地（遵循要点符号）访问这些

另一个有用的函数是value_counts（），它可以很好地显示内部，例如分类值及其频率：

print(df['Pclass'].value_counts())

用SQL描述模式如果您想描述多个表，那么应该查询名为information_schema的系统表，该表将为整个模式提供相同的数据

SELECT 
   table_name, 
   column_name, 
   data_type 
FROM 
   information_schema.columns
WHERE 
   table_name = 'city';

您是要描述模式还是表？如果描述模式，那么系统表将更有用。这可以通过类似sql的方式完成：“从信息_schema.tables中选择不同的表_name，其中表_schema='schema_name'和表_type，如'BASE_table'”——这取决于您的sql风格。如果您描述单数表，那么您应该在数据帧中拥有所需的所有内容（如果您使用pandas作为标记），即数据类型和列名。数据库已经设置好了，我想展示它目前是如何基于模式工作的，以改进模式。如果我能更容易地展示模式的效率，那就太好了！您使用的是哪种数据库技术？你所说的效率是什么意思？Postgresql所说的效率。我们在报告功能中使用了很多分类。它们并不是真正计划好的，因此表中的一列可以有多个字符串值，而引用另一个值可能会有多个字符串值。还有一些列表示与其他列相同的内容，通常很少对表进行分隔以对相关数据集进行分组。所以我想从视觉上展示这是一个案例，并给出一些结构来作为一个问题来改进它。谢谢这篇文章。我对修复问题中的循环特别感兴趣，因为我可以使用value_counts（）、.dtypes等，但我想尝试为给定表中的每一列创建一张图片。

SELECT 
   table_name, 
   column_name, 
   data_type 
FROM 
   information_schema.columns
WHERE 
   table_name = 'city';