Python 如何删除特殊字符和字符之间的空格?
我正在使用scrapy+python。我已经尝试从作业url中提取作业ID数据,任何人都可以指导我提取 我必须单独提取这一内容“总监财务规划分析” 还需要删除特殊字符太DirectorFinancialPlanningAnalysis 我的预期输出应该是:董事财务计划分析 我的蜘蛛代码是:Python 如何删除特殊字符和字符之间的空格?,python,python-2.7,selenium,selenium-webdriver,scrapy,Python,Python 2.7,Selenium,Selenium Webdriver,Scrapy,我正在使用scrapy+python。我已经尝试从作业url中提取作业ID数据,任何人都可以指导我提取 我必须单独提取这一内容“总监财务规划分析” 还需要删除特殊字符太DirectorFinancialPlanningAnalysis 我的预期输出应该是:董事财务计划分析 我的蜘蛛代码是: hxs = Selector(response) item = response.request.meta['item'] item ['JobDetailUrl'] = response.url ite
hxs = Selector(response)
item = response.request.meta['item']
item ['JobDetailUrl'] = response.url
item ['InternalJobId'] = item ['JobDetailUrl'].re('.*\/(.*?)\.html').groups()
我的输出错误:
item ['InternalJobId'] = item['JobDetailUrl'].re('.*\/(.*?)\.html')
.groups()
exceptions.AttributeError: 'str' object has no attribute 're'
re()
是选择器
对象上的方法,此处为响应。url
是字符串:
re.search(r'([a-zA-Z\-]+)\.html$', response.url).group(1).replace('-', '')
演示:
>>> import re
>>> s = 'http://xxxxx/apply/EkhIMG/Director-Financial-Planning-Analysis.html'
>>> re.search(r'([a-zA-Z\-]+)\.html$', s).group(1).replace('-', '')
'DirectorFinancialPlanningAnalysis'