Python 使用lxml将数据刮取到JSON中_Python_Lxml

Python 使用lxml将数据刮取到JSON中

python

Python 使用lxml将数据刮取到JSON中,python,lxml,Python,Lxml,我正在尝试使用lxml获取数据。在html中，我有这样一行： <p class="datetime is-upcomming">March 10, Tuesday, 18:00 CET</p> 然后我尝试使用以下函数保存到JSON中： def __dict__(self, get_streams=False): data = { 'game': self.game, 'title': self.title, } d

我正在尝试使用lxml获取数据。在html中，我有这样一行：

<p class="datetime is-upcomming">March 10, Tuesday, 18:00 CET</p>

然后我尝试使用以下函数保存到JSON中：

def __dict__(self, get_streams=False):
    data = {
        'game': self.game,
        'title': self.title,
    }
    data['start_date'] = self.get_date()

为什么会返回数组？为什么它是空的

"start_date": [
""
]

是的，我已经仔细检查了是否有一个类的datetime正在升级

为什么会返回数组？为什么它是空的

"start_date": [
""
]

因为它总是返回一个列表，如果没有找到任何内容，则返回一个空列表

您的xpath可能不正确，是否可以发布整个文档或在哪里找到它

另外，为什么要使用

\uuuuu dict\uuuu

而不是一种新的方法

\uuuu dict\uuuu

是实例属性字典，除非您知道自己在做什么，否则我不会弄乱它

你能分享一下self.url的价值吗？谢谢。为什么会返回一个数组？你指的是哪种方法？您的

\uuuu dict\uuuu

不会返回任何内容，因为它会对用于保存实例属性的对象的

\uuuu dict\uuuu

进行阴影处理，您可能只看到一个名为

start\u date

的局部变量。我认为您的第一步是将

def\uu dict\uuu（…）

重命名为其他变量。您不应该使用方法对对象

\uuuuu dict\uuuu

进行阴影处理。或者该值由javascript和

请求设置。content

包含带有空文本的元素。我已经在评论中要求了链接：）让我们等一等。@alecxe我明白了，那个。很抱歉，我一开始以为你是OP。这是一个API，我正在尝试编辑。我正在尝试从站点添加开始日期属性。dict就是制作API的人，是谁制作的。我想他知道自己在干什么：）