Python 使用lxml将数据刮取到JSON中
我正在尝试使用lxml获取数据。在html中,我有这样一行:Python 使用lxml将数据刮取到JSON中,python,lxml,Python,Lxml,我正在尝试使用lxml获取数据。在html中,我有这样一行: <p class="datetime is-upcomming">March 10, Tuesday, 18:00 CET</p> 然后我尝试使用以下函数保存到JSON中: def __dict__(self, get_streams=False): data = { 'game': self.game, 'title': self.title, } d
<p class="datetime is-upcomming">March 10, Tuesday, 18:00 CET</p>
然后我尝试使用以下函数保存到JSON中:
def __dict__(self, get_streams=False):
data = {
'game': self.game,
'title': self.title,
}
data['start_date'] = self.get_date()
为什么会返回数组?为什么它是空的
"start_date": [
""
]
是的,我已经仔细检查了是否有一个类的datetime正在升级
为什么会返回数组?为什么它是空的
"start_date": [
""
]
因为它总是返回一个列表,如果没有找到任何内容,则返回一个空列表
您的xpath可能不正确,是否可以发布整个文档或在哪里找到它
另外,为什么要使用
\uuuuu dict\uuuu
而不是一种新的方法\uuuu dict\uuuu
是实例属性字典,除非您知道自己在做什么,否则我不会弄乱它 你能分享一下self.url的价值吗?谢谢。为什么会返回一个数组?你指的是哪种方法?您的\uuuu dict\uuuu
不会返回任何内容,因为它会对用于保存实例属性的对象的\uuuu dict\uuuu
进行阴影处理,您可能只看到一个名为start\u date
的局部变量。我认为您的第一步是将def\uu dict\uuu(…)
重命名为其他变量。您不应该使用方法对对象\uuuuu dict\uuuu
进行阴影处理。或者该值由javascript和请求设置。content
包含带有空文本的元素。我已经在评论中要求了链接:)让我们等一等。@alecxe我明白了,那个。很抱歉,我一开始以为你是OP。这是一个API,我正在尝试编辑。我正在尝试从站点添加开始日期属性。dict就是制作API的人,是谁制作的。我想他知道自己在干什么:)