Python 为什么在导入带有熊猫的数据文件时忽略列中的数字
我正在尝试从一个github站点导入数据,该站点是带有pandas的csv格式。它似乎工作得很好,只是“ZIP”列并没有导入所有数字。邮政编码应该有5位数字,但似乎前面的1或2位数字被省略了。为什么 我要导入数据: 出于某种原因,它看起来像这样,但是拉链应该是00601Python 为什么在导入带有熊猫的数据文件时忽略列中的数字,python,pandas,numpy,Python,Pandas,Numpy,我正在尝试从一个github站点导入数据,该站点是带有pandas的csv格式。它似乎工作得很好,只是“ZIP”列并没有导入所有数字。邮政编码应该有5位数字,但似乎前面的1或2位数字被省略了。为什么 我要导入数据: 出于某种原因,它看起来像这样,但是拉链应该是00601 原因是熊猫会自动推断列的dtype,并最终为ZIP列指定integerdtype,因为它只由数字组成 您必须明确声明它们是字符串,否则00601将只是601 您可以使用read\u csv pd.read_csv(file, d
原因是熊猫会自动推断列的
dtype
,并最终为ZIP列指定integer
dtype,因为它只由数字组成
您必须明确声明它们是字符串,否则00601
将只是601
您可以使用read\u csv
pd.read_csv(file, dtype={'ZIP': str})
@大卫巴克尼斯,韦斯·麦金尼本人的回答;)
ZIP LAT LNG
0 601 18.180555 -66.749961
pd.read_csv(file, dtype={'ZIP': str})