Python 使用中的read_table()指定数据类型

Python 使用中的read_table()指定数据类型,python,pandas,Python,Pandas,我正在将一个文本文件加载到熊猫中,并且有一个包含年份的字段。我想确保这个字段在拉入数据帧时是一个字符串 如果我使用下面的代码指定字符串的确切长度,我似乎只能实现这一点: df=pd.read_table('myfile.tsv',dtype={'year':'S4'}) 有没有一种方法可以在不指定长度的情况下执行此操作?我需要对长度不同的不同列执行此操作。我相信我们在0.12中启用了此操作 您可以传递str,np.str,对象来代替S4 在任何情况下都会转换为objectdtype 或者在你读过

我正在将一个文本文件加载到熊猫中,并且有一个包含年份的字段。我想确保这个字段在拉入数据帧时是一个字符串

如果我使用下面的代码指定字符串的确切长度,我似乎只能实现这一点: df=pd.read_table('myfile.tsv',dtype={'year':'S4'})


有没有一种方法可以在不指定长度的情况下执行此操作?我需要对长度不同的不同列执行此操作。

我相信我们在0.12中启用了此操作

您可以传递
str
np.str
对象来代替
S4
在任何情况下都会转换为
object
dtype

或者在你读过之后


df['year'].astype(object)

是的,如果你真的想把str作为一个数据类型(或S4)传递,那么它就是chnge(使你能够传递str)——两个r都使用11.0转换成objectAm am。使用str和np.str似乎不起作用。但是使用'object'可以->pd.read_table('myfile.tsv',dtype={'year':object})。