Python 熊猫能否输出CSV文件的推断模式？_Python_Pandas_Csv_Data Science_Data Wrangling

Python 熊猫能否输出CSV文件的推断模式？

python pandas csv

Python 熊猫能否输出CSV文件的推断模式？,python,pandas,csv,data-science,data-wrangling,Python,Pandas,Csv,Data Science,Data Wrangling,是否有一种方法可以用于使用pandas在大型CSV上输出推断的模式？此外，有没有办法让它告诉我该类型是否基于CSV为空/空白？该文件大约有500k行，250列在我的新工作中，我经常收到带有零格式文档的CSV文件。是否需要加载整个CSV文件？如果您知道分隔符，至少可以使用read_csv函数，或者对文件进行分类以了解分隔符。然后使用.info（） df=pd.read\u csv（指向文件的路径，…） df.info（） IMO，您可以将csv读入dataframe中，然后执行一系列功能df

是否有一种方法可以用于使用pandas在大型CSV上输出推断的模式？此外，有没有办法让它告诉我该类型是否基于CSV为空/空白？该文件大约有500k行，250列

在我的新工作中，我经常收到带有零格式文档的CSV文件。

是否需要加载整个CSV文件？如果您知道分隔符，至少可以使用read_csv函数，或者对文件进行分类以了解分隔符。然后使用.info（）

df=pd.read\u csv（指向文件的路径，…）
df.info（）

IMO，您可以将

csv

读入

dataframe

中，然后执行一系列功能

df.shape

告诉您存在多少行和列

df.isna（）.any（）

告诉您哪些列可以为空。需要更多的信息来理解你到底在寻找什么。我想输出原始列名及其数据类型。通过这种方式，我可以将其转换为希望每个列都有更多信息的系统，如Microsoft SQL Server、Postgres、SQLite或AWS数据管道（Hive/Pig）。在对列执行循环时，您能获得此非空计数吗？对此，惯用的方法是什么。使用Python，我希望根据类型和可空信息生成一个数据库DDL文件。好的，至少一个起点DDL您可以使用df.columns、df.dtypes、df['your column name'].isnull（）.values.any（）和f-string来创建DDL基线。好主意。非常感谢。