Python 试图将存储在pandas结构中的字符串传递给方法
所以我把数据存储在熊猫结构中。我的数据中有一列是由字符串组成的 一个接一个,我希望能够穿过熊猫结构,把绳子拉出来。将其发送到一个方法,该方法将其清除,然后将其存储回Python 试图将存储在pandas结构中的字符串传递给方法,python,string,python-3.x,pandas,Python,String,Python 3.x,Pandas,所以我把数据存储在熊猫结构中。我的数据中有一列是由字符串组成的 一个接一个,我希望能够穿过熊猫结构,把绳子拉出来。将其发送到一个方法,该方法将其清除,然后将其存储回 data = pd.read_csv('ml_dataset_train1.csv', ) data.dropna(how="all", inplace=True) text = data.loc[data['Id']>=0,['Interview']] trainDataPercent = 0.75 train_dat
data = pd.read_csv('ml_dataset_train1.csv', )
data.dropna(how="all", inplace=True)
text = data.loc[data['Id']>=0,['Interview']]
trainDataPercent = 0.75
train_data = text[0:int(trainDataPercent*len(text))]
test_data = text[int(trainDataPercent*len(text)):len(text)]
texts = train_data
for i in range(0, len(texts)):
texts.iat[i, 0] = cd.review_to_words(texts.iat[i, 0])
这给了我一个错误,我的方法需要一个字符串。更奇怪的是,当我检查text.iat[1,0]
的类型时,我得到了“class'str'”
那么,为什么我的方法不接受它呢?也许其他一些索引有一些不同于
str
,而不是第一个索引?您是否尝试过在中为
循环添加一个条件-如果是instance(text.iat[i,0]),str:
?在该列中,它们都是字符串。或者,也许他们并不取决于熊猫是如何应对的。但是,它们是来自csv文件中文本的字符序列。或者,您也可以打印i
,并准确地检查出现错误的i
,然后检查csv中的该行。如果您在该行中找不到任何问题,您可以将其添加到此处,我们可以尝试检查