Php 存储图形数据的最有效方法

Php 存储图形数据的最有效方法,php,mysql,graph,data-storage,Php,Mysql,Graph,Data Storage,我总共提出了三种不同的、同样可行的方法来保存图形数据 有问题的图表是“随着时间的推移,球员在不同类别中的得分”。类别包括“建筑”、“物品”、“任务完成”、“成就”等 方法1: 此表包含每个用户/日期/类别组合的一行。要显示用户数据,请选择按userid。旧条目通过以下方式清除: DELETE FROM `graphdata` WHERE `date` < DATE_ADD(NOW(),INTERVAL -1 WEEK) 由于是主键,按用户id选择更快。每天的分数都会向下移动,如: ...

我总共提出了三种不同的、同样可行的方法来保存图形数据

有问题的图表是“随着时间的推移,球员在不同类别中的得分”。类别包括“建筑”、“物品”、“任务完成”、“成就”等

方法1: 此表包含每个用户/日期/类别组合的一行。要显示用户数据,请选择按
userid
。旧条目通过以下方式清除:

DELETE FROM `graphdata` WHERE `date` < DATE_ADD(NOW(),INTERVAL -1 WEEK)
由于是主键,按用户id选择更快。每天的分数都会向下移动,如:

... SET `buildings-3day`=`buildings-2day`, `buildings-2day`=`buildings-1day`...
条目不会被删除(除非用户删除其帐户)。在重复键更新时,可以使用
INSERT…添加/更新行

方法3: 为每个用户使用一个文件,其中包含他们分数数据的JSON编码数组。由于数据无论如何都是通过AJAX JSON调用获取的,这意味着可以静态地获取文件(甚至可以缓存到下一个午夜),而不会对服务器造成任何压力。服务器每天运行每个文件,
shift()
s从每个数组中删除最旧的分数,
push()
s在最后删除新的分数


就我个人而言,我认为方法3是目前为止最好的,但是我听说过使用文件而不是数据库的不好的事情——例如,如果我想能够根据用户在不同类别中的得分对用户进行排名,这种解决方案将是非常糟糕的

在这两个数据库解决方案中,我已经在我的一个老项目上实现了方法2,而且似乎效果很好。方法1似乎“更好”,因为它更好地利用了关系数据库和所有这些东西,但我有点担心它将包含
(用户数)*(类别数)*7行,这可能是一个很大的数字


我是否缺少任何东西可以帮助我最终决定使用哪种方法?1、2、3或以上任何一种?

如果要使用关系数据库,方法1比方法2好得多。它是标准化的,因此易于维护和搜索。我会将
日期
字段更改为
时间戳
,并将其称为
added\u on
(或类似“date”这样的非保留字)。我会添加一个自动递增主键
score\u id
,这样用户id/date/category就不必是唯一的。这样,如果一个用户在同一秒钟内成功增加了他的建筑分数两次,两次都会被记录下来

第二种方法要求您每天更新所有记录。第一种方法只进行插入,不进行更新,因此每个记录只写入一次

。。。设置
建筑物-3天
=
建筑物-2天
建筑物-2天
=
建筑物-1天

你真的想每天更新表中的每一条记录直到时间结束吗

由于是主键,按用户id选择更快

由于
user\u id
是方法1主键中的第一个字段,因此查找速度同样快。作为常规索引中的第一个字段(这是我上面建议的),它仍然会非常快

关系数据库的思想是每一行代表一个实例/动作/事件。因此,当一个用户做了一些事情来影响他的分数时,做一个插入来记录他所做的事情。您总是可以根据这样的数据创建摘要。但是你不能从总结中得到这样的数据

其次,您似乎非常关心如何删除旧数据。为什么?select查询的日期范围将自动排除旧数据。如果您关心性能,您可以基于行龄创建表,或者设置cronjob定期删除旧记录

ETA:关于存储在文件中的JSON 在我看来,这似乎结合了方法2的缺点(难以搜索,每个文件必须每天更新)和文件访问的其他缺点。文件访问是昂贵的。文件写入更是如此。如果您真的想存储摘要数据,我只会在请求数据时运行查询,并将结果按用户id存储在摘要表中。该表可以包含JSON字符串:

CREATE TABLE score_summaries(
user_id INT unsigned NOT NULL PRIMARY KEY,
gen_date TIMESTAMP DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
json_data TEXT NOT NULL DEFAULT '{}'
);
例如:

Bob(user_id=7)首次登录游戏。他在他的个人资料页面上显示他的每周统计数据。这些查询运行:

SELECT json_data FROM score_summaries 
  WHERE user_id=7 
    AND gen_date > DATE_SUB(CURDATE() INTERVAL 1 DAY); 
//returns nothing so generate summary record

SELECT DATE(added_on), category, SUM(score) 
  FROM scores WHERE user_id=7 AND added_on < CURDATE() AND > DATE_SUB(CURDATE(), INTERVAL 1 WEEK)
  GROUP BY DATE(added_on), category; //never include today's data, encode as json with php

INSERT INTO score_summaries(user_id, json_data)
  VALUES(7, '$json') //from PHP, in this case $json == NULL
  ON DUPLICATE KEY UPDATE json_data=VALUES(json_data)

//use $json for presentation too
从分数摘要中选择json数据
其中user_id=7
和gen_date>date_SUB(CURDATE()间隔1天);
//不返回任何内容,因此生成摘要记录
选择日期(已添加)、类别、总和(分数)
根据用户id=7并在DATE\u子项(CURDATE(),间隔1周)上添加的分数
按日期分组(已添加),类别//永远不要包含今天的数据,用php编码为json
插入得分摘要(用户id、json数据)
值(7,'$json')//来自PHP,在本例中,$json==NULL
重复密钥时更新json_数据=值(json_数据)
//也可以使用$json进行表示

今天的分数是根据需要生成的,而不是存储在摘要中。如果Bob今天再次查看他的分数,历史分数可以来自汇总表,也可以存储在第一次请求后的会话中。如果Bob有一周没有来,就不需要生成摘要。

方法1对我来说显然是个赢家。若您担心单个表(graphData)的大小过大,可以通过创建

CREATE TABLE `graphdata` (
    `graphDataId` INT UNSIGNED NOT NULL,
    `categoryId` INT NOT NULL,
    `score` FLOAT UNSIGNED NOT NULL,
    PRIMARY KEY (`GraphDataId'),
) ENGINE=InnoDB
而不是创建两个表,因为您显然需要有连接graphDataId和userId的信息

create table 'graphDataUser'(
         `graphDataId` INT UNSIGNED NOT NULL,
        `userId` INT NOT NULL,
)ENGINE=InnoDB
和graphDataId日期连接

create table 'graphDataDate'(
         `graphDataId` INT UNSIGNED NOT NULL,
        'graphDataDate' DATE NOT NULL
)ENGINE=InnoDB
我认为您实际上不需要担心某些表包含的行数,因为大多数dba在行数方面做得很好。您的工作只是以一种易于检索的方式格式化数据,无论检索数据的任务是什么。从长远来看,我认为使用这些建议应该会有回报。

关于
(用户数量)*(用户数量)的答案是什么
create table 'graphDataUser'(
         `graphDataId` INT UNSIGNED NOT NULL,
        `userId` INT NOT NULL,
)ENGINE=InnoDB
create table 'graphDataDate'(
         `graphDataId` INT UNSIGNED NOT NULL,
        'graphDataDate' DATE NOT NULL
)ENGINE=InnoDB