跳过转义序列字符Python Scrapy
我正在抓取一个网站,但我得到了转义序列字符的输出。字符如下:跳过转义序列字符Python Scrapy,python,scrapy,Python,Scrapy,我正在抓取一个网站,但我得到了转义序列字符的输出。字符如下: \r\n\t\xa 我尝试了.split()方法,但这个方法的问题是,当scrapy crawler找不到单个值时,它不会刮取任何值并移动到下一个迭代 绕过这些角色的最佳方式是什么 输出结果如下: Python可以实现这一点 >>重新导入 >>>re.sub(r'\s+','',''\t\xa0“) ' ' >>>关于sub(r'\s+','',“\t\xa0 py\t\t\xa0 thon”) “皮顿” >>>#然后可以使用str.
\r\n\t\xa
我尝试了.split()方法,但这个方法的问题是,当scrapy crawler找不到单个值时,它不会刮取任何值并移动到下一个迭代
绕过这些角色的最佳方式是什么
输出结果如下:
Python可以实现这一点
>>重新导入
>>>re.sub(r'\s+','',''\t\xa0“)
' '
>>>关于sub(r'\s+','',“\t\xa0 py\t\t\xa0 thon”)
“皮顿”
>>>#然后可以使用str.strip删除周围的任何空间
>>>re.sub(r'\s+','',“\t\xa0 py\t\t\xa0 thon”).strip()
“皮顿”
尝试不拆分