Python 获取类型错误:应为字符串或类似字节的对象

Python 获取类型错误:应为字符串或类似字节的对象,python,regex,python-3.x,jupyter-notebook,Python,Regex,Python 3.x,Jupyter Notebook,我面临着一个挑战,我试图使用python中的正则表达式清除数据集中的一列。该列是对象类型的,当我使用下面的代码时,我得到了这个错误:预期的字符串或类似于对象的字节 import re def clean_str(string): """ Tokenization/string cleaning for dataset Every dataset is lower cased except """ string = re.sub(r"\n", "", st

我面临着一个挑战,我试图使用python中的正则表达式清除数据集中的一列。该列是对象类型的,当我使用下面的代码时,我得到了这个错误:预期的字符串或类似于对象的字节

import re 
def clean_str(string):
    """
    Tokenization/string cleaning for dataset
    Every dataset is lower cased except
    """
    string = re.sub(r"\n", "", string)    
    string = re.sub(r"\r", "", string) 
    string = re.sub(r"[0-9]", "digit", string)
    string = re.sub(r"\'", "", string)   
    string = re.sub(r"\"", "", string)    
    return string.strip().lower()
X = []
for i in range(df.shape[0]):
    X.append(clean_str(df.iloc[i][1])) #0,1,2,3
y = np.array(df["Standardpositionsname"])
我认为在
X.append(clean_str(df.iloc[I][1])
中,必须将参数转换为字符串类型 像这样


X.append(clean_str(str(df.iloc[i][1]))

请正确缩进代码。就目前情况而言,代码是不可读的。你现在能读吗?哦,天哪,不。换一种方式更好。错误消息中有行号吗?我应该共享回溯呼叫吗?那会有帮助吗?当然。而且总是这样。