如何通过Python中的Selenium从一个相对于多个分隔符动态变化的字符串中检索子字符串
我想知道是否有可能移除部分刮掉的绳子,如:如何通过Python中的Selenium从一个相对于多个分隔符动态变化的字符串中检索子字符串,python,selenium,selenium-webdriver,web-scraping,split,Python,Selenium,Selenium Webdriver,Web Scraping,Split,我想知道是否有可能移除部分刮掉的绳子,如: Wujek Drew / Uncle Drew 进入 德鲁叔叔 当然,由于它是网页抓取,每次的标题都会不同,所以我可以在这里做些什么来获得上面的结果呢 更新 我忘了添加一些需要删除的内容Wujek Drew/Uncle Drew(2018)我需要删除字符串末尾的数据。要删除由/字符分隔的刮取字符串的第一部分,可以使用以下解决方案: value = driver.find_element_by_xpath("element_xpath").get_a
Wujek Drew / Uncle Drew
进入
德鲁叔叔
当然,由于它是网页抓取,每次的标题都会不同,所以我可以在这里做些什么来获得上面的结果呢
更新
我忘了添加一些需要删除的内容Wujek Drew/Uncle Drew(2018)我需要删除字符串末尾的数据。要删除由/字符分隔的刮取字符串的第一部分,可以使用以下解决方案:
value = driver.find_element_by_xpath("element_xpath").get_attribute("innerHTML").split("/")[1]
import re
value = driver.find_element_by_xpath("element_xpath").get_attribute("innerHTML")
#value='Wujek Drew / Uncle Drew (2018)'
print(re.split('[/()]',value)[1])
根据您的评论更新,如果您想从字符串Wujek Drew/Drew叔叔(2018)中提取子字符串Drew叔叔,您可以使用以下解决方案:
value = driver.find_element_by_xpath("element_xpath").get_attribute("innerHTML").split("/")[1]
import re
value = driver.find_element_by_xpath("element_xpath").get_attribute("innerHTML")
#value='Wujek Drew / Uncle Drew (2018)'
print(re.split('[/()]',value)[1])
您是否总是希望忽略斜杠字符之前的所有内容?如果可能的话,斜杠可以用来删除句子的第一部分。谢谢。我忘了添加一些需要删除的内容。Wujek Drew/Drew叔叔(2018)我需要删除字符串末尾的数据。试图使用您的解决方案,但遇到了困难。@serengeti签出我的答案更新并让我知道状态谢谢更新。试过了,这是我得到的@serengeti I已删除应答更新中的
拆分(“/”[1]
部分,并使用re.split()
进行处理。请交叉核对。好的:)冷静。仔细观察。在我的答案的第一个版本中,我提取了整个innerHTML
,并在同一步骤中调用了split()
。其中,与我的答案的更新版本一样,在第一步中,我仅提取了整个innerHTML
。在下一行中,我执行了split()
。这是有区别的。