Python 循环来描述数据库表的内容

Python 循环来描述数据库表的内容,python,pandas,Python,Pandas,我试图创建一个表模式的概述,并找到改进的地方 list_columns = reporting.columns.tolist() description = [] x = 0 for x in list_columns: description.append(reporting[x].describe()) x=x+1 这是我当前的方法-它失败了,因为description方法返回一些无法整理成列表或dict的内容 感谢您的帮助。描述一张有熊猫的桌子 如果使用pandas函数

我试图创建一个表模式的概述,并找到改进的地方

list_columns = reporting.columns.tolist()

description = []
x = 0
for x in list_columns:
    description.append(reporting[x].describe())
    x=x+1
这是我当前的方法-它失败了,因为description方法返回一些无法整理成列表或dict的内容

感谢您的帮助。

描述一张有熊猫的桌子 如果使用pandas函数读取表(例如,此处有代码),则应获得一个dataframe作为输出,该dataframe定义了正确的列名和数据类型

然后,您可以通过简单地(遵循要点符号)访问这些

另一个有用的函数是value_counts(),它可以很好地显示内部,例如分类值及其频率:

print(df['Pclass'].value_counts())
用SQL描述模式 如果您想描述多个表,那么应该查询名为information_schema的系统表,该表将为整个模式提供相同的数据

SELECT 
   table_name, 
   column_name, 
   data_type 
FROM 
   information_schema.columns
WHERE 
   table_name = 'city';

您是要描述模式还是表?如果描述模式,那么系统表将更有用。这可以通过类似sql的方式完成:“从信息_schema.tables中选择不同的表_name,其中表_schema='schema_name'和表_type,如'BASE_table'”——这取决于您的sql风格。如果您描述单数表,那么您应该在数据帧中拥有所需的所有内容(如果您使用pandas作为标记),即数据类型和列名。数据库已经设置好了,我想展示它目前是如何基于模式工作的,以改进模式。如果我能更容易地展示模式的效率,那就太好了!您使用的是哪种数据库技术?你所说的效率是什么意思?Postgresql所说的效率。我们在报告功能中使用了很多分类。它们并不是真正计划好的,因此表中的一列可以有多个字符串值,而引用另一个值可能会有多个字符串值。还有一些列表示与其他列相同的内容,通常很少对表进行分隔以对相关数据集进行分组。所以我想从视觉上展示这是一个案例,并给出一些结构来作为一个问题来改进它。谢谢这篇文章。我对修复问题中的循环特别感兴趣,因为我可以使用value_counts()、.dtypes等,但我想尝试为给定表中的每一列创建一张图片。
SELECT 
   table_name, 
   column_name, 
   data_type 
FROM 
   information_schema.columns
WHERE 
   table_name = 'city';