Deep learning 错误:无法对像对象情感分析这样的字节使用字符串模式

Deep learning 错误:无法对像对象情感分析这样的字节使用字符串模式,deep-learning,nlp,sentiment-analysis,Deep Learning,Nlp,Sentiment Analysis,我试图用正则表达式和许多其他东西来删除URL以清理数据,为此我有以下函数 def depure(数据): ''' 输入:数据 输出:不带#URL、电子邮件、字符和单引号的数据 ''' #删除带有正则表达式的URL(不确定它们是否存在) regex=r'https?://\S+| www\.\S+' url\u pattern=re.compile(正则表达式) data=url\u pattern.sub(r'',数据) #删除电子邮件 data=re.sub('\S*@\S*\S?','',数

我试图用正则表达式和许多其他东西来删除URL以清理数据,为此我有以下函数

def depure(数据):
'''
输入:数据
输出:不带#URL、电子邮件、字符和单引号的数据
'''
#删除带有正则表达式的URL(不确定它们是否存在)
regex=r'https?://\S+| www\.\S+'
url\u pattern=re.compile(正则表达式)
data=url\u pattern.sub(r'',数据)
#删除电子邮件
data=re.sub('\S*@\S*\S?','',数据)
#删除新行字符
data=re.sub('\s+','',data)
#删除分散注意力的单引号
data=re.sub(“\”,“,”数据)
返回数据
但我不知道为什么,我已经试图解决这个错误,但什么也没有

test_temp = []
#tranform data sequences to list
train_to_list = train_data.tolist()
test_to_list = test_data.tolist()

#for train data
for i in range(len(train_data)):
  train_temp.append(depure(train_data[i]))
train_words = list(sent_to_words(train_temp))
new_train = []
for i in range(len(train_words)):
  new_train.append(detokenize(train_data[i]))
输出错误:

---------------------------------------------------------------------------
TypeError回溯(最近一次调用上次)
在()
7#列车数据
8对于范围内的i(len(列_数据)):
---->9列车温度附加(拆卸(列车数据[i]))
10列车文字=列表(发送至列车文字(列车临时))
11新列车=[]
1帧
/sub中的usr/lib/python3.7/re.py(模式、repl、字符串、计数、标志)
192一个可调用的,它传递了Match对象并且必须返回
193要使用的替换字符串。”“”
-->194返回编译(模式、标志).sub(repl、字符串、计数)
195
196 def子网(模式、应答、字符串、计数=0、标志=0):
TypeError:无法在类似字节的对象上使用字符串模式
有人能帮我吗