Python 在web抓取时包含伪元素
当我使用Python从web上进行抓取时,我试图找到一种方法来包含或至少识别伪元素(由::after留下的逗号)。当前正在清理右键单击Spotify Web上的歌曲并选择“显示信用”时出现的框 例如,当我从这个框中刮取文本时,它会不带分隔地给出表演者的姓名。我已经用正则表达式解决了这个问题,但是迭代500首歌曲是不可行的,因为创作艺术家的名字不一致。我正在使用Selenium,但是没有找到任何关于尝试我想要做的事情的文档,同样的文档也适用于beautifulsoup 伪元素::after出现在下面的html中,我希望有一种方法可以包含或识别它Python 在web抓取时包含伪元素,python,web-scraping,spotify,pseudo-element,Python,Web Scraping,Spotify,Pseudo Element,当我使用Python从web上进行抓取时,我试图找到一种方法来包含或至少识别伪元素(由::after留下的逗号)。当前正在清理右键单击Spotify Web上的歌曲并选择“显示信用”时出现的框 例如,当我从这个框中刮取文本时,它会不带分隔地给出表演者的姓名。我已经用正则表达式解决了这个问题,但是迭代500首歌曲是不可行的,因为创作艺术家的名字不一致。我正在使用Selenium,但是没有找到任何关于尝试我想要做的事情的文档,同样的文档也适用于beautifulsoup 伪元素::after出现在
打印(element.text)
浅薄的
执行人
布拉德利·库佩雷迪·加加
布拉德利·库珀
::之后