Python 在抓取web数据时无法删除\r\n\t?
当我从网站上抓取html表时,我想删除td.text内容的所有\r\n\t开头和结尾部分 以下是我的代码,以便:Python 在抓取web数据时无法删除\r\n\t?,python,beautifulsoup,strip,Python,Beautifulsoup,Strip,当我从网站上抓取html表时,我想删除td.text内容的所有\r\n\t开头和结尾部分 以下是我的代码,以便: row.append(td.text.strip('\n').strip('\r').strip('\t').strip('"').strip().strip(':').strip(' ')) 如果没有strip functon,结果如下所示: [['BP / Age', ': \r\n\r\n USA/ 2', 'FirstName', ':\r\
row.append(td.text.strip('\n').strip('\r').strip('\t').strip('"').strip().strip(':').strip(' '))
如果没有strip functon,结果如下所示:
[['BP / Age',
': \r\n\r\n USA/ 2',
'FirstName',
':\r\n\t \t \r\n Walker\r\n\t \n\n']]
[['BP / Age',
': \r\n\r\n USA/ 2',
'FirstName',
':\r\n\t \t \r\n Walker']]
使用strip functon,结果如下所示:
[['BP / Age',
': \r\n\r\n USA/ 2',
'FirstName',
':\r\n\t \t \r\n Walker\r\n\t \n\n']]
[['BP / Age',
': \r\n\r\n USA/ 2',
'FirstName',
':\r\n\t \t \r\n Walker']]
我如何才能清除剩余的\r\n\t?不要尝试增量剥离。然后,您需要指定字符的确切显示顺序,这很可能对所有字符串都是相同的,并且必须反映前导和尾随部分的顺序 您可以一次全部剥离:
row.append(td.text.strip('\n\r\t": '))
演示:
如果答案是有用的,你可以考虑接受。