Python 熊猫能否输出CSV文件的推断模式?

Python 熊猫能否输出CSV文件的推断模式?,python,pandas,csv,data-science,data-wrangling,Python,Pandas,Csv,Data Science,Data Wrangling,是否有一种方法可以用于使用pandas在大型CSV上输出推断的模式? 此外,有没有办法让它告诉我该类型是否基于CSV为空/空白? 该文件大约有500k行,250列 在我的新工作中,我经常收到带有零格式文档的CSV文件。是否需要加载整个CSV文件?如果您知道分隔符,至少可以使用read_csv函数,或者对文件进行分类以了解分隔符。然后使用.info() df=pd.read\u csv(指向文件的路径,…) df.info() IMO,您可以将csv读入dataframe中,然后执行一系列功能df

是否有一种方法可以用于使用pandas在大型CSV上输出推断的模式? 此外,有没有办法让它告诉我该类型是否基于CSV为空/空白? 该文件大约有500k行,250列


在我的新工作中,我经常收到带有零格式文档的CSV文件。

是否需要加载整个CSV文件?如果您知道分隔符,至少可以使用read_csv函数,或者对文件进行分类以了解分隔符。然后使用.info()

df=pd.read\u csv(指向文件的路径,…)
df.info()

IMO,您可以将
csv
读入
dataframe
中,然后执行一系列功能
df.shape
告诉您存在多少行和列
df.isna().any()
告诉您哪些列可以为空。需要更多的信息来理解你到底在寻找什么。我想输出原始列名及其数据类型。通过这种方式,我可以将其转换为希望每个列都有更多信息的系统,如Microsoft SQL Server、Postgres、SQLite或AWS数据管道(Hive/Pig)。在对列执行循环时,您能获得此非空计数吗?对此,惯用的方法是什么。使用Python,我希望根据类型和可空信息生成一个数据库DDL文件。好的,至少一个起点DDL您可以使用df.columns、df.dtypes、df['your column name'].isnull().values.any()和f-string来创建DDL基线。好主意。非常感谢。