基于列的内容隔离列时出现问题';它是用Python写在csv文件中的

基于列的内容隔离列时出现问题';它是用Python写在csv文件中的,python,csv,jupyter-notebook,Python,Csv,Jupyter Notebook,我有一个巨大的csv文件,有超过1200万行和4列,第一列只是按0到1200万的顺序排列,第二列有这个东西所在的地区的名称,第三列是一个城市(每个城市都有一个数字),第四列有游客的数量。 我想做的是绘制第三列和第四列(一列在x上,一列在y上),但仅针对某个区域,我尝试了很多方法来读取文件中显示“Essex”的部分,但没有任何效果,第二列称为“区域”,我感兴趣的区域是“Essex”,有什么帮助吗?谢谢大家! 您应该查看名为“”的标准库。像这样的东西可以让你行动起来: import csv wit

我有一个巨大的csv文件,有超过1200万行和4列,第一列只是按0到1200万的顺序排列,第二列有这个东西所在的地区的名称,第三列是一个城市(每个城市都有一个数字),第四列有游客的数量。
我想做的是绘制第三列和第四列(一列在x上,一列在y上),但仅针对某个区域,我尝试了很多方法来读取文件中显示“Essex”的部分,但没有任何效果,第二列称为“区域”,我感兴趣的区域是“Essex”,有什么帮助吗?谢谢大家!

您应该查看名为“”的标准库。像这样的东西可以让你行动起来:

import csv

with open("name of csv file") as csvfile:
    reader = csv.reader(csvfile)
    for row in reader:
        # Check for Essex
        if row[1] == 'Essex':
            # Do whatever
            pass
上面的示例假设CSV文件中没有标题行。如果确实有标题,可以按如下方式跳过它:

with open("name of csv file") as csvfile:
    # Read and skip a header line.
    header = csvfile.readline()
    reader = csv.reader(csvfile)
    for row in reader:
        # As above

或者查看csv.DictReader()。

简短添加:减少缩进代码的数量始终是一种好的做法。所以
如果第[1]行!='Essex':继续
,而不是缩进重要的代码。非常感谢,这将返回一系列单独的值,这意味着当我尝试根据行[3]绘制行[2]而不是一个包含许多列的大直方图时,我会得到许多不同的直方图,如何将所有行[2]分组为x和所有行[3]加起来就是y,所以x的第一个值和y的第一个值,依此类推,很抱歉,我对Python很陌生,非常感谢,这听起来很简单?打开文件,将文件处理程序交给csv读取器,迭代行,每当行满足要求时收集它(或直接将其写入文件),然后将收集的行写入一个仅包含所需内容的文件。我错过什么了吗?你能在你的问题中添加一些样本数据吗?