Python 使用lxml和xpath进行解析
我正在尝试解析网站的特定表 在这个网站上,我需要在python上使用xlml和xpath获取专栏(姓名和标题、职业、级别) 到目前为止,我有以下代码:Python 使用lxml和xpath进行解析,python,xpath,lxml,Python,Xpath,Lxml,我正在尝试解析网站的特定表 在这个网站上,我需要在python上使用xlml和xpath获取专栏(姓名和标题、职业、级别) 到目前为止,我有以下代码: import lxml.html import requests from lxml import html url = "http://www.tibia.com/community/?subtopic=guilds&page=view&GuildName=Black%20Widow" html = lxml.html.pa
import lxml.html
import requests
from lxml import html
url = "http://www.tibia.com/community/?subtopic=guilds&page=view&GuildName=Black%20Widow"
html = lxml.html.parse(url)
list = html.xpath("//table[@class='TableContent'][1]/tr/td[2]/text()")
列表
假设给我第一列“名称和标题”的文本,但我收到的是一个充满'\xa0'
我确实使用在vb.net上制作了相同的代码,并且运行平稳,我可以在这里发布vb.net应用程序的代码,以便您可以更好地看到我想要做的事情。如果您需要从
“Name and Title”
列中获取值,您可以在XPath
下面尝试:
//table[@class='TableContent']//td/a/text()
还要注意的是,您不应该使用
“list”
作为变量名,因为它是Python
内置类的一个名称,这正是我想要了解的,现在我将开始研究如何将这些信息传递到mysql数据表:D