基于列的内容隔离列时出现问题'；它是用Python写在csv文件中的_Python_Csv_Jupyter Notebook

基于列的内容隔离列时出现问题'；它是用Python写在csv文件中的

python csv jupyter-notebook

基于列的内容隔离列时出现问题'；它是用Python写在csv文件中的,python,csv,jupyter-notebook,Python,Csv,Jupyter Notebook,我有一个巨大的csv文件，有超过1200万行和4列，第一列只是按0到1200万的顺序排列，第二列有这个东西所在的地区的名称，第三列是一个城市（每个城市都有一个数字），第四列有游客的数量。我想做的是绘制第三列和第四列（一列在x上，一列在y上），但仅针对某个区域，我尝试了很多方法来读取文件中显示“Essex”的部分，但没有任何效果，第二列称为“区域”，我感兴趣的区域是“Essex”，有什么帮助吗？谢谢大家! 您应该查看名为“”的标准库。像这样的东西可以让你行动起来： import csv wit

我有一个巨大的csv文件，有超过1200万行和4列，第一列只是按0到1200万的顺序排列，第二列有这个东西所在的地区的名称，第三列是一个城市（每个城市都有一个数字），第四列有游客的数量。

我想做的是绘制第三列和第四列（一列在x上，一列在y上），但仅针对某个区域，我尝试了很多方法来读取文件中显示“Essex”的部分，但没有任何效果，第二列称为“区域”，我感兴趣的区域是“Essex”，有什么帮助吗？谢谢大家!

您应该查看名为“”的标准库。像这样的东西可以让你行动起来：

import csv

with open("name of csv file") as csvfile:
    reader = csv.reader(csvfile)
    for row in reader:
        # Check for Essex
        if row[1] == 'Essex':
            # Do whatever
            pass

上面的示例假设CSV文件中没有标题行。如果确实有标题，可以按如下方式跳过它：

with open("name of csv file") as csvfile:
    # Read and skip a header line.
    header = csvfile.readline()
    reader = csv.reader(csvfile)
    for row in reader:
        # As above

或者查看csv.DictReader（）。

简短添加：减少缩进代码的数量始终是一种好的做法。所以

如果第[1]行！='Essex'：继续

，而不是缩进重要的代码。非常感谢，这将返回一系列单独的值，这意味着当我尝试根据行[3]绘制行[2]而不是一个包含许多列的大直方图时，我会得到许多不同的直方图，如何将所有行[2]分组为x和所有行[3]加起来就是y，所以x的第一个值和y的第一个值，依此类推，很抱歉，我对Python很陌生，非常感谢，这听起来很简单？打开文件，将文件处理程序交给csv读取器，迭代行，每当行满足要求时收集它（或直接将其写入文件），然后将收集的行写入一个仅包含所需内容的文件。我错过什么了吗？你能在你的问题中添加一些样本数据吗？