如何使用jQuery/Javascript/PHP更快地处理大型XML文件_Javascript_Php_Jquery_Xml_Gzip

如何使用jQuery/Javascript/PHP更快地处理大型XML文件

javascript php jquery xml

如何使用jQuery/Javascript/PHP更快地处理大型XML文件,javascript,php,jquery,xml,gzip,Javascript,Php,Jquery,Xml,Gzip,我正在制作一个商店概览页面，每页呈现+20种产品。我从压缩（gzip）XML文件（*.XML.gz）获取数据。以下是提要：每天一次，我用PHP将文件下载到服务器并提取XML文件问题是，解压后的XML文件大小为+-60MB，包含超过50k个产品。现在，当我试图从XML文件中获取产品并显示它们时，速度非常慢。使用下面的代码，从本地XML显示产品信息大约需要8秒钟： $.ajax({ type: "GET", url: 'feeds/awin_affiliates_eu.xml',

我正在制作一个商店概览页面，每页呈现+20种产品。我从压缩（gzip）XML文件（*.XML.gz）获取数据。以下是提要：每天一次，我用PHP将文件下载到服务器并提取XML文件

问题是，解压后的XML文件大小为+-60MB，包含超过50k个产品。现在，当我试图从XML文件中获取产品并显示它们时，速度非常慢。使用下面的代码，从本地XML显示产品信息大约需要8秒钟：

$.ajax({
    type: "GET",
    url: 'feeds/awin_affiliates_eu.xml',
    cache: true,
    dataType: "xml",

    error: function (response) {
        alert("An error occurred while processing XML file");
        console.log('XML reading Failed: ', e);
    },

    success: function (response) {
        var max = 20;
        $(response).find("product").each(function (i) {

            if (i < max) {

                var _pid = $(this).find('pid').text();
                var _mpn = $(this).find('mpn').text();
                var _colour = $(this).find('colour').text();
                var _name = $(this).find('name').text();
                var _purl = $(this).find('purl').text();
                var _instock = $(this).find('instock').text();
                var _brand = $(this).find('brand').text();
                var _suitable_for = $(this).find('suitable_for').text();
                var _ptype = $(this).find('ptype').text();
                var _category = $(this).find('category').text();
                var _condition = $(this).find('condition').text();
                var _desc = $(this).find('desc').text();
                var _currency = $(this).find('currency').text();
                var _custom1 = $(this).find('custom1').text();
                var _price = $(this).find('price').text();
                var _deltime = $(this).find('deltime').text();
                var _delcost = $(this).find('delcost').text();
                var _imgurl = $(this).find('imgurl').text();
                var _alternate_image = $(this).find('alternate_image').text();

                $("h2._name").eq(i).text(_name);
                $(".price").eq(i).text(_price);
                var background_url = "url(" + _imgurl + ")";
                $(".panel").eq(i).css("background", background_url);

            } else {

                return false;
            }
        });
        console.log('done reading file');
    }
});

$.ajax({
键入：“获取”，
url:'feeds/awin_affiliates_eu.xml'，
是的，
数据类型：“xml”，
错误：函数（响应）{
警报（“处理XML文件时出错”）；
log（'XML读取失败：'，e）；
},
成功：功能（响应）{
var max=20；
$（响应）。查找（“产品”）。每个（功能（i）{
如果（i


有什么方法可以更快地读取XML文件，以便更高效地呈现我的产品吗？
PHP有XMLReader/XMLWriter用于大型XML文件。生成的XML不是很大（取决于每页产品的限制）。因此，您可以使用DOM进行编写，并且只需要XMLReader
下面是一个简化XML的示例：
$data = <<<'XML'
<merchant xmlns="http://www.w3.org/2005/Atom" xmlns:g="http://base.google.com/ns/1.0">
  <title>End | Globally Sourced Menswear</title>
  <product><name>Comme des Garcons Play Full Zip Hoody</name></product>
  <product><name>Pharrell: Places &amp; Spaces I've Been - Pink Cover</name></product>
  <product><name>The Rig Out Issue 6</name></product>
  <product><name>Baxter of California Beard Comb</name></product>
  <product><name>Baxter of California Comb</name></product>
</merchant>
XML;

$template = <<<'XML'
<merchant xmlns="http://www.w3.org/2005/Atom" xmlns:g="http://base.google.com/ns/1.0"/>
XML;

$reader = new XMLReader();
$reader->open('data://text/plain;base64,'.base64_encode($data));

// prepare the target document
$document = new DOMDocument();
$document->preserveWhiteSpace = FALSE;
$document->loadXML($template);

// iterate to the first product element
do {
  $found = $reader->read();
} while ($found && $reader->localName !== 'product');

$offset = 0;
$limit = 2;
$end = $offset + $limit;

$i = 0;
while ($found && $i < $end) {
  if ($offset <= $i) {
    // expand the current "product" and append it to the "merchant" node
    $document->documentElement->appendChild($reader->expand($document));
  }
  $i++;
  $found = $reader->next('product');
}

$document->formatOutput = TRUE;
echo $document->saveXML();

您还应该考虑将文件（XMLReald+DOM）解析为数据库（SQLite，…）或搜索索引（弹性搜索，…）。这将允许您生成过滤结果
顺便说一句，您的XML文件看起来已损坏。它将Atom定义为默认名称空间，我看不到任何使用g
前缀定义Google名称空间的元素。我希望merchant
和product
成为该名称空间的一部分
 显示产品信息大约需要8秒钟
下载60MB需要多少时间？（在100mbit的互联网连接上，如果没有其他情况发生，则至少需要5秒的时间-因此，我猜这8秒可能主要是下载时间-解决这一问题的唯一方法是更快的互联网连接）@epascarello-return false
将停止jquerys每个循环。您可以设置一个cron作业，每天下载、解析数据并将所需数据存储在数据库中。然后，应用程序的其余部分只需要从数据库中查询数据。每天一次，我用PHP将文件下载到我的服务器并提取XML文件-然后您应该只在提取的XML中包含前20个产品-PHP肯定有能力以这种方式处理XML吗？@JaromandaX 60 MB大约需要800毫秒根据我的chrome开发者模式。我现在也在当地工作。最大的停机时间是等待。
<?xml version="1.0"?>
<merchant xmlns="http://www.w3.org/2005/Atom" xmlns:g="http://base.google.com/ns/1.0">
  <product>
    <name>Comme des Garcons Play Full Zip Hoody</name>
  </product>
  <product>
    <name>Pharrell: Places &amp; Spaces I've Been - Pink Cover</name>
  </product>
</merchant>

[Page] => Duration
[1] => 3ms
[51] => 14ms
[101] => 25ms
[151] => 35ms
[201] => 44ms
[251] => 55ms
[301] => 66ms
[351] => 91ms
[401] => 95ms
[451] => 110ms