Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/317.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何通过Python中的Selenium从一个相对于多个分隔符动态变化的字符串中检索子字符串_Python_Selenium_Selenium Webdriver_Web Scraping_Split - Fatal编程技术网

如何通过Python中的Selenium从一个相对于多个分隔符动态变化的字符串中检索子字符串

如何通过Python中的Selenium从一个相对于多个分隔符动态变化的字符串中检索子字符串,python,selenium,selenium-webdriver,web-scraping,split,Python,Selenium,Selenium Webdriver,Web Scraping,Split,我想知道是否有可能移除部分刮掉的绳子,如: Wujek Drew / Uncle Drew 进入 德鲁叔叔 当然,由于它是网页抓取,每次的标题都会不同,所以我可以在这里做些什么来获得上面的结果呢 更新 我忘了添加一些需要删除的内容Wujek Drew/Uncle Drew(2018)我需要删除字符串末尾的数据。要删除由/字符分隔的刮取字符串的第一部分,可以使用以下解决方案: value = driver.find_element_by_xpath("element_xpath").get_a

我想知道是否有可能移除部分刮掉的绳子,如:

Wujek Drew / Uncle Drew
进入

德鲁叔叔

当然,由于它是网页抓取,每次的标题都会不同,所以我可以在这里做些什么来获得上面的结果呢


更新
我忘了添加一些需要删除的内容Wujek Drew/Uncle Drew(2018)我需要删除字符串末尾的数据。

要删除由/字符分隔的刮取字符串的第一部分,可以使用以下解决方案:

value = driver.find_element_by_xpath("element_xpath").get_attribute("innerHTML").split("/")[1] 
import re

value = driver.find_element_by_xpath("element_xpath").get_attribute("innerHTML")
#value='Wujek Drew / Uncle Drew (2018)'
print(re.split('[/()]',value)[1])

根据您的评论更新,如果您想从字符串Wujek Drew/Drew叔叔(2018)中提取子字符串Drew叔叔,您可以使用以下解决方案:

value = driver.find_element_by_xpath("element_xpath").get_attribute("innerHTML").split("/")[1] 
import re

value = driver.find_element_by_xpath("element_xpath").get_attribute("innerHTML")
#value='Wujek Drew / Uncle Drew (2018)'
print(re.split('[/()]',value)[1])

您是否总是希望忽略斜杠字符之前的所有内容?如果可能的话,斜杠可以用来删除句子的第一部分。谢谢。我忘了添加一些需要删除的内容。Wujek Drew/Drew叔叔(2018)我需要删除字符串末尾的数据。试图使用您的解决方案,但遇到了困难。@serengeti签出我的答案更新并让我知道状态谢谢更新。试过了,这是我得到的@serengeti I已删除应答更新中的
拆分(“/”[1]
部分,并使用
re.split()
进行处理。请交叉核对。好的:)冷静。仔细观察。在我的答案的第一个版本中,我提取了整个
innerHTML
,并在同一步骤中调用了
split()
。其中,与我的答案的更新版本一样,在第一步中,我仅提取了整个
innerHTML
。在下一行中,我执行了
split()
。这是有区别的。