Python 使用Beautifulsoup从脚本中提取文本

Python 使用Beautifulsoup从脚本中提取文本,python,beautifulsoup,web-crawler,Python,Beautifulsoup,Web Crawler,我从我的爬虫程序获取此脚本: [{"display_name":"AERIN","status":4,"value":5024296}],"type":"checkboxes"},{"display_name":"Bristle Type","values":[{"display_name":"Addictive","status":1,"value":14578019},{"display_name":"Chic","status":1,"value":14301148}],"

我从我的爬虫程序获取此脚本:

        [{"display_name":"AERIN","status":4,"value":5024296}],"type":"checkboxes"},{"display_name":"Bristle Type","values":[{"display_name":"Addictive","status":1,"value":14578019},{"display_name":"Chic","status":1,"value":14301148}],"type":"checkboxes"},{"display_name":"Coverage","values":
。 .


如何提取[{“display_name”:?

这看起来可能是你从汤中提取的某个JSON。如果是这样,你想用
things=JSON.loads(thatstring)
解析它。然后,你会有一个dict列表。如果你知道这个列表总是只有一个元素,那么它就是
things[0]['display_name']
。如果你不知道,你可能想在things:中循环
,然后用
thing['display_name']
做点什么。谢谢!你能再解释一下吗。Json对我来说是新的。我必须包括导入Json,对吗?我按照你的说明包括了以下几行:jsons=Json.loads(productoslvl)element=jsons[0]['display_name']print(element)但是,我在加载'not{!r}'格式中得到了错误行348)是的,您必须导入它。有关一些好的示例,请参阅模块的文档页面。如果没有更多上下文,很难帮助您调试您的问题。如果您可以提供一个新问题,或者作为一个新问题或编辑成这个问题,并提供演示问题的代码和示例数据(理想情况下,从一个小的静态字符串文本中创建一个soup,该文本的HTML刚好足以演示如何提取该字符串,然后尝试对其进行解析),这应该很容易调试。此外,如果错误表明这是无效的JSON,您应该尝试将其复制并粘贴到在线JSON验证器中(我没有特别推荐的,但是在网络搜索中有很多,而且看起来都不错),你可能需要包括你从哪里获得的信息(例如,一个从URL下载页面的脚本,然后用它制作汤)-e、 g.,可能不是JSON,只是碰巧看起来非常相似的东西,在这种情况下,如果不知道它来自何处,没有人能够分辨出来。)谢谢你的帮助!它让我对下一步有了很多了解。但我仍然没有关于如何提取数据的线索。我发布了另一个问题和细节。