Python 在::之前(xpath、css)之后刮取文本
我已经构建了一个Scrapy Spider,希望从以下位置获取电子邮件文本: ::之前 “电子邮件” “我想刮的电子邮件”Python 在::之前(xpath、css)之后刮取文本,python,xpath,scrapy,css-selectors,Python,Xpath,Scrapy,Css Selectors,我已经构建了一个Scrapy Spider,希望从以下位置获取电子邮件文本: ::之前 “电子邮件” “我想刮的电子邮件” 我尝试过:“email”:response.css(“#content>div.segment.morecontact.clearfix>div>div>div.secondary>ul>li:nth child(1)>a>I::text”).extract(),但我只收到了“电子邮件”,而没有收到实际的地址,你需要一个简单的XPath下面的兄弟::*: email =
我尝试过:“email”:response.css(“#content>div.segment.morecontact.clearfix>div>div>div.secondary>ul>li:nth child(1)>a>I::text”).extract(),但我只收到了“电子邮件”,而没有收到实际的地址,你需要一个简单的XPath
下面的兄弟::*
:
email = response.xpath('//i[contains(@class, "icon_email")]/following-sibling::text()[1]').get()
您可以使用另一种方法从href
属性获取电子邮件:
email=response.xpath('//a[i[contains(@class,“icon_email”)]/@href').re_first(r'mailto:(.+))你能发送实际的html代码片段吗当然,也许这是一个愚蠢的问题,但具体如何?我能给它拍张照片然后剪下来吗?谢谢你的直接链接,我需要班级图标的电子邮件。图标\u电子邮件你能突出显示你想刮的部分并给我截图吗。我将向您发送xpath表达式非常感谢,稍后我将试用并回信!再次感谢,谢谢,它能工作,但现在我明白了,一些电子邮件文本在span中位于另一个之下,所以我只得到电子邮件文本的开头部分。有没有一种方法可以连接整个电子邮件文本?示例:“在”“fo@”“中,某些”“文本”“.com”“之间始终有一个span类。再次感谢:)比如这封电子邮件