如何通过Python中的Selenium从一个相对于多个分隔符动态变化的字符串中检索子字符串_Python_Selenium_Selenium Webdriver_Web Scraping_Split

如何通过Python中的Selenium从一个相对于多个分隔符动态变化的字符串中检索子字符串

python selenium selenium-webdriver web-scraping

如何通过Python中的Selenium从一个相对于多个分隔符动态变化的字符串中检索子字符串,python,selenium,selenium-webdriver,web-scraping,split,Python,Selenium,Selenium Webdriver,Web Scraping,Split,我想知道是否有可能移除部分刮掉的绳子，如： Wujek Drew / Uncle Drew 进入德鲁叔叔当然，由于它是网页抓取，每次的标题都会不同，所以我可以在这里做些什么来获得上面的结果呢更新我忘了添加一些需要删除的内容Wujek Drew/Uncle Drew（2018）我需要删除字符串末尾的数据。要删除由/字符分隔的刮取字符串的第一部分，可以使用以下解决方案： value = driver.find_element_by_xpath("element_xpath").get_a

我想知道是否有可能移除部分刮掉的绳子，如：

Wujek Drew / Uncle Drew

进入

德鲁叔叔

当然，由于它是网页抓取，每次的标题都会不同，所以我可以在这里做些什么来获得上面的结果呢

更新

我忘了添加一些需要删除的内容Wujek Drew/Uncle Drew（2018）我需要删除字符串末尾的数据。

要删除由/字符分隔的刮取字符串的第一部分，可以使用以下解决方案：

value = driver.find_element_by_xpath("element_xpath").get_attribute("innerHTML").split("/")[1]

import re

value = driver.find_element_by_xpath("element_xpath").get_attribute("innerHTML")
#value='Wujek Drew / Uncle Drew (2018)'
print(re.split('[/()]',value)[1])

根据您的评论更新，如果您想从字符串Wujek Drew/Drew叔叔（2018）中提取子字符串Drew叔叔，您可以使用以下解决方案：

value = driver.find_element_by_xpath("element_xpath").get_attribute("innerHTML").split("/")[1]

import re

value = driver.find_element_by_xpath("element_xpath").get_attribute("innerHTML")
#value='Wujek Drew / Uncle Drew (2018)'
print(re.split('[/()]',value)[1])

您是否总是希望忽略斜杠字符之前的所有内容？如果可能的话，斜杠可以用来删除句子的第一部分。谢谢。我忘了添加一些需要删除的内容。Wujek Drew/Drew叔叔（2018）我需要删除字符串末尾的数据。试图使用您的解决方案，但遇到了困难。@serengeti签出我的答案更新并让我知道状态谢谢更新。试过了，这是我得到的@serengeti I已删除应答更新中的

拆分（“/”[1]

部分，并使用

re.split（）

进行处理。请交叉核对。好的：）冷静。仔细观察。在我的答案的第一个版本中，我提取了整个

innerHTML

，并在同一步骤中调用了

split（）

。其中，与我的答案的更新版本一样，在第一步中，我仅提取了整个

innerHTML

。在下一行中，我执行了

split（）

。这是有区别的。