Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/328.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/json/14.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 使用内部的ajax json解析html_Python_Json_Screen Scraping_Html Parsing_Web Scraping - Fatal编程技术网

Python 使用内部的ajax json解析html

Python 使用内部的ajax json解析html,python,json,screen-scraping,html-parsing,web-scraping,Python,Json,Screen Scraping,Html Parsing,Web Scraping,我有这样的文件要用Python解析(从废弃中): some HTML and JS here... SomeValue = { 'calendar': [ { 's0Date': new Date(2010, 9, 12), 'values': [ { 's1Date': new Date(2010, 9, 17), 'price': 9900 }, {

我有这样的文件要用Python解析(从废弃中):

some HTML and JS here...
SomeValue = 
{
     'calendar': [
     {       's0Date': new Date(2010, 9, 12),
             'values': [
                     { 's1Date': new Date(2010, 9, 17), 'price': 9900 },
                     { 's1Date': new Date(2010, 9, 18), 'price': 9900 },
                     { 's1Date': new Date(2010, 9, 19), 'price': 9900 },
                     { 's1Date': new Date(2010, 9, 20), 'price': 9900 },
                     { 's1Date': new Date(2010, 9, 21), 'price': 9900 },
                     { 's1Date': new Date(2010, 9, 22), 'price': 9900 },
                     { 's1Date': new Date(2010, 9, 23), 'price': 9900 }]
     },
     'data': [{
     index: 0,
     serviceClass: 'Economy',
     prices: [9900, 320.43, 253.27],
     eTicketing: true,
     segments: [{
             indexSegment: 0,
             stopsCount: 1,
             flights: [{
                     index: 0,

... and a lot of nested data and again HTML and JS...
我需要解析它并提取所有json数据。现在,我使用带有清除所有'\n'和'\t'以及eval()函数的正则表达式将其转换为Python字典。。我真的不喜欢这个解决方案,尤其是eval()。但我查看了BeautifulSoup和lxml,没有找到有助于解析它的内容。
您能为这项任务推荐比正则表达式和eval()更好的方法吗?
页面示例:


使用
json
模块处理json数据:

import json
json.loads( <string> )
如果您需要特定的帮助,则需要提供特定的数据,例如,包含此数据的标记的类别。例如,您可以
soup.findAll
脚本标记,然后剥离一些行以获得JSON,然后将其输入
JSON.loads


使用
json
模块处理json数据:

import json
json.loads( <string> )

如果您需要特定的帮助,则需要提供特定的数据,例如,包含此数据的标记的类别。例如,您可以
soup.findAll
脚本标记,然后剥离一些行以获得JSON,然后将其输入到
JSON中。加载

是否所有的JS都包含在
标记中?如果是这样的话,使用yes应该不难,请参见第页的“谢谢,不知何故我错过了简单的HTML语法”以及
标记中包含的所有JS?如果是这样的话,使用yes应该不难,请参见第页的“谢谢,不知何故我错过了简单的HTML语法”。如果我使用simplejson,它无法加载数据。loads()工作得非常好。感谢您使用simplejson,它无法加载数据。loads()工作得非常好。谢谢