Python 使用Beautifulsoup从脚本中提取文本_Python_Beautifulsoup_Web Crawler

Python 使用Beautifulsoup从脚本中提取文本

python web-crawler

Python 使用Beautifulsoup从脚本中提取文本,python,beautifulsoup,web-crawler,Python,Beautifulsoup,Web Crawler,我从我的爬虫程序获取此脚本： [{"display_name":"AERIN","status":4,"value":5024296}],"type":"checkboxes"},{"display_name":"Bristle Type","values":[{"display_name":"Addictive","status":1,"value":14578019},{"display_name":"Chic","status":1,"value":14301148}],"

我从我的爬虫程序获取此脚本：

        [{"display_name":"AERIN","status":4,"value":5024296}],"type":"checkboxes"},{"display_name":"Bristle Type","values":[{"display_name":"Addictive","status":1,"value":14578019},{"display_name":"Chic","status":1,"value":14301148}],"type":"checkboxes"},{"display_name":"Coverage","values":

。 .

如何提取[{“display_name”：？

这看起来可能是你从汤中提取的某个JSON。如果是这样，你想用

things=JSON.loads（thatstring）

解析它。然后，你会有一个dict列表。如果你知道这个列表总是只有一个元素，那么它就是

things[0]['display_name']

。如果你不知道，你可能想在things:中循环

，然后用thing['display_name']
做点什么。谢谢！你能再解释一下吗。Json对我来说是新的。我必须包括导入Json，对吗？我按照你的说明包括了以下几行：jsons=Json.loads（productoslvl）element=jsons[0]['display_name']print（element）但是，我在加载'not{！r}'格式中得到了错误行348)是的，您必须导入它。有关一些好的示例，请参阅模块的文档页面。如果没有更多上下文，很难帮助您调试您的问题。如果您可以提供一个新问题，或者作为一个新问题或编辑成这个问题，并提供演示问题的代码和示例数据（理想情况下，从一个小的静态字符串文本中创建一个soup，该文本的HTML刚好足以演示如何提取该字符串，然后尝试对其进行解析），这应该很容易调试。此外，如果错误表明这是无效的JSON，您应该尝试将其复制并粘贴到在线JSON验证器中（我没有特别推荐的，但是在网络搜索中有很多，而且看起来都不错），你可能需要包括你从哪里获得的信息（例如，一个从URL下载页面的脚本，然后用它制作汤）-e、 g.，可能不是JSON，只是碰巧看起来非常相似的东西，在这种情况下，如果不知道它来自何处，没有人能够分辨出来。）谢谢你的帮助！它让我对下一步有了很多了解。但我仍然没有关于如何提取数据的线索。我发布了另一个问题和细节。