Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/python-2.7/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何删除特殊字符和字符之间的空格?_Python_Python 2.7_Selenium_Selenium Webdriver_Scrapy - Fatal编程技术网

Python 如何删除特殊字符和字符之间的空格?

Python 如何删除特殊字符和字符之间的空格?,python,python-2.7,selenium,selenium-webdriver,scrapy,Python,Python 2.7,Selenium,Selenium Webdriver,Scrapy,我正在使用scrapy+python。我已经尝试从作业url中提取作业ID数据,任何人都可以指导我提取 我必须单独提取这一内容“总监财务规划分析” 还需要删除特殊字符太DirectorFinancialPlanningAnalysis 我的预期输出应该是:董事财务计划分析 我的蜘蛛代码是: hxs = Selector(response) item = response.request.meta['item'] item ['JobDetailUrl'] = response.url ite

我正在使用scrapy+python。我已经尝试从作业url中提取作业ID数据,任何人都可以指导我提取

我必须单独提取这一内容“总监财务规划分析”

还需要删除特殊字符太DirectorFinancialPlanningAnalysis

我的预期输出应该是:董事财务计划分析

我的蜘蛛代码是:

hxs = Selector(response) 
item = response.request.meta['item']
item ['JobDetailUrl'] = response.url
item ['InternalJobId'] = item ['JobDetailUrl'].re('.*\/(.*?)\.html').groups()
我的输出错误:

item ['InternalJobId'] = item['JobDetailUrl'].re('.*\/(.*?)\.html')
.groups()
exceptions.AttributeError: 'str' object has no attribute 're'
re()
选择器
对象上的方法,此处为
响应。url
是字符串:

re.search(r'([a-zA-Z\-]+)\.html$', response.url).group(1).replace('-', '')
演示:

>>> import re
>>> s = 'http://xxxxx/apply/EkhIMG/Director-Financial-Planning-Analysis.html'
>>> re.search(r'([a-zA-Z\-]+)\.html$', s).group(1).replace('-', '')
'DirectorFinancialPlanningAnalysis'