读取python中的csv文件_Python_Csv

读取python中的csv文件

python csv

读取python中的csv文件,python,csv,Python,Csv,我需要从文件夹中的多个csv文件中读取一列，然后从该列中提取最小和最大日期例如，如果我有文件夹路径/usr/abc/xyz/并且存在多个csv文件，如下所示 aaa.csv bbb.csv ccc.csv 这些文件包含数据 aaa.csv包含数据 name,address,dates xxx,11111,20190101 yyy,22222,20190201 zzz,33333,20190101 name,address,dates fff,11111,20190301 ggg,22222

我需要从文件夹中的多个csv文件中读取一列，然后从该列中提取最小和最大日期

例如，如果我有文件夹路径/usr/abc/xyz/并且存在多个csv文件，如下所示

aaa.csv
bbb.csv
ccc.csv

这些文件包含数据

aaa.csv包含数据

name,address,dates
xxx,11111,20190101
yyy,22222,20190201
zzz,33333,20190101

name,address,dates
fff,11111,20190301
ggg,22222,20190501
hhh,33333,20190601

bbb.csv包含数据

name,address,dates
xxx,11111,20190101
yyy,22222,20190201
zzz,33333,20190101

name,address,dates
fff,11111,20190301
ggg,22222,20190501
hhh,33333,20190601

因此，我需要从文件中提取最小和最大日期，在上述情况下，日期范围应为20190101到20190601

有人能帮我从python文件中提取最小和最大日期吗

我需要避免熊猫或任何其他软件包，因为我需要在Pyton中直接读取csv文件

import pandas as pd

dt = pd.read_csv('you_csv.csv')
print(max(dt['dates']))
print(min(dt['dates']))

如果你需要避免熊猫，你可以做以下一点都不推荐的事情：

dt = []
with open('your_csv.csv', 'r') as f:
    data = f.readlines()
for row in data:
    dt.append(row.split(',')[2].rstrip())
dt.pop(0)
print(max(dt))
print(min(dt))

仅使用可用核心库的解决方案。它不会将整个文件读入内存，因此占用空间应该非常小，并且可以处理较大的文件

pathlib用于获取所有csv文件 datetime用于转换为日期 sys用于用户输入 $python3 date\u min\u max.py/usr/abc/xyz/ 最小日期：2019-01-01 00:00:00 最长日期：2019-06-01 00:00:00 日期\最小值\最大值从pathlib导入路径从日期时间导入日期时间导入系统如果lensys.argv>1： p=sys.argv[1] 其他： p=。文件=[x代表Pathp.iterdir中的x，如果x.suffix==.csv] 日期\u格式=%Y%m%d dt_max=datetime.strptime19000101，日期格式 dt_min=datetime.strptime3000101，日期格式对于文件中的文件：使用file.openr作为fh：对于i，FH中的行：如果i==0：持续 t=线、带、分割[2] dt_max=maxdt_max，datetime.strpimet，date_格式 dt_min=mindt_min，datetime.strpimet，date_格式 printmin日期：{}\n最大日期：{}。格式dt_min，dt_max

我建议你找一个基本的熊猫教程，类似这样的东西应该可以：我不确定，为什么要否决这个问题。正如我在问题中已经说过的，我不想使用熊猫或任何其他软件包，我已经提到我不想使用熊猫等。第二种方法值得怀疑，因为你说它会读取文件夹中的所有csv？@aspire一点也不。它将文件读取为字符串，并拆分所需的内容。