Mysql 查询执行速度随着订单的增加而急剧降低

Mysql 查询执行速度随着订单的增加而急剧降低,mysql,indexing,Mysql,Indexing,我有以下疑问 SELECt SUM(GA) AS GA1, sales_data_mkt.mkt_cd FROM sales_data_mkt WHERE activity_dt between '2015-09-01' AND '2015-09-30' and sales_data_mkt.MKT_CD is not null GROUP BY sales_data_mkt.mkt_cd HAVING ga1 > 0 LIMIT 10 其解释 执行时间:6

我有以下疑问

SELECt
  SUM(GA) AS GA1,
  sales_data_mkt.mkt_cd
FROM
  sales_data_mkt 
WHERE activity_dt between '2015-09-01' 
  AND '2015-09-30'
    and sales_data_mkt.MKT_CD is not null
GROUP BY sales_data_mkt.mkt_cd
HAVING ga1 > 0 
LIMIT 10
其解释

执行时间:6-7秒

id  select_type table           type     possible_keys                  key        key_len      ref     rows       Extra;
1   SIMPLE      sales_data_mkt  range    ACTIVITY_DT,REGION_CD,MKT_CD   MKT_CD     13           null    4954774    Using where
现在我添加了
orderby
子句

EXPLAIN SELECT
  SUM(GA) AS GA1,
  sales_data_mkt.mkt_cd
FROM
  sales_data_mkt 
WHERE activity_dt BETWEEN '2015-09-01' 
  AND '2015-09-30'
    AND sales_data_mkt.MKT_CD IS NOT NULL
GROUP BY sales_data_mkt.mkt_cd
HAVING ga1 > 0 
ORDER BY SUM(ga) DESC 
LIMIT 10
其解释

执行时间:600秒

id  select_type   table             type     possible_keys                  key     key_len   ref     rows      Extra;
1   SIMPLE        sales_data_mkt    range    ACTIVITY_DT,REGION_CD,MKT_CD   MKT_CD  13        null    4954774   Using where\; Using temporary\; Using filesort
sales\u data\u mkt
有1000万行。活动的最小值为2015年1月1日,最大值为2015年10月6日。基本上每月大约100万行

存在以下索引:

  • 区域cd(区域cd、活动dt)
  • 活动日(活动日、市场日)
  • 区域cd(区域cd,市场cd活动)
  • 市场活动cd(市场活动)
  • 以下是create语句:

    CREATE TABLE `sales_data_mkt` (
      `ACTIVITY_DT` date DEFAULT NULL,
      `Country_Cd` char(3) NOT NULL DEFAULT 'USA',
      `AREA_CD` char(2) DEFAULT NULL,
      `AREA_DESC` varchar(30) DEFAULT NULL,
      `REGION_CD` char(2) DEFAULT NULL,
      `REGION_DESC` varchar(30) DEFAULT NULL,
      `MKT_CD` char(4) DEFAULT NULL,
      `MKT_NAME` varchar(30) DEFAULT NULL,
      `device_tier` varchar(32) DEFAULT NULL,
      `SLS_DIST_CHNL_TYPE_CD` char(3) DEFAULT NULL,
      `PPlan_Type` varchar(14) DEFAULT NULL,
      `PREPAID_IND` char(1) DEFAULT NULL,
      `edge_taken_ind` varchar(1) DEFAULT NULL,
      `Edge_Desc` varchar(16) DEFAULT NULL,
      `Data_Plan_Tier` varchar(26) DEFAULT NULL,
      `Unlimited_to_Others_cnt` int(11) DEFAULT NULL,
      `Data_Step_UP_Cnt` int(11) DEFAULT NULL,
      `Data_Step_Down_Cnt` int(11) DEFAULT NULL,
      `lines` int(11) DEFAULT NULL,
      `GA` int(11) DEFAULT NULL,
      `DE` int(11) DEFAULT NULL,
      `NetAdd` int(11) DEFAULT NULL,
      `VOL_DE` int(11) DEFAULT NULL,
      `INVOL_DE` int(11) DEFAULT NULL,
      `PortIn_ATT_Leap` int(11) DEFAULT NULL,
      `PortIn_Sprint_Nextel` int(11) DEFAULT NULL,
      `PortIn_TMobile_MetroPcs` int(11) DEFAULT NULL,
      `PortIn_OtherCarriers` int(11) DEFAULT NULL,
      `PortOut_ATT_Leap` int(11) DEFAULT NULL,
      `PortOut_Sprint_Nextel` int(11) DEFAULT NULL,
      `PortOut_TMobile_MetroPcs` int(11) DEFAULT NULL,
      `PortOut_OtherCarriers` int(11) DEFAULT NULL,
      `Edge_Net_Sales` int(11) DEFAULT NULL,
      `Edge_Eligible_Net_Sales` int(11) DEFAULT NULL,
      `Edge_Net_Sales_All` int(11) DEFAULT NULL,
      `Basic_To_Smart` int(11) DEFAULT NULL,
      `AAL` int(11) DEFAULT NULL,
      `New_To_VZ` int(11) DEFAULT NULL,
      `Trade_In` int(11) DEFAULT NULL,
      `Unlimited_to_Others` int(11) DEFAULT NULL,
      `Data_Step_Up` int(11) DEFAULT NULL,
      `Data_Step_Down` int(11) DEFAULT NULL,
      KEY `AREA_CD` (`AREA_CD`,`ACTIVITY_DT`),
      KEY `ACTIVITY_DT` (`ACTIVITY_DT`,`MKT_CD`),
      KEY `REGION_CD` (`REGION_CD`,`MKT_CD`,`ACTIVITY_DT`),
      KEY `MKT_CD` (`MKT_CD`,`ACTIVITY_DT`)
    ) ENGINE=InnoDB DEFAULT CHARSET=utf8
    
    我需要哪些指标来提高绩效


    注意:
    就像对
    GA
    列的查询一样,我对表中的其他列还有其他查询。这让我害怕在
    GA
    和表中的每个其他KPI列上创建索引。

    对于索引,我认为您需要在字段上创建索引:

      activity_dt, mkt_cd, ga 
    

    按这个顺序。通过这种方式,select应该解决索引中的所有信息需求,避免访问表数据。

    除了GA之外,我还有其他列的类似脚本。该表中还有大约30个其他指标。在所有索引上添加索引是可持续的吗?如果你在工作时有一个带有此字段序列的索引,如果其他索引没有此序列,它们就没有多大用处。我应该评估一下,但是。。。。如果不是在insert、update和delete期间,添加索引本身并不意味着性能降低,因为在这些期间,必须对所有索引重复执行单个操作。这将看到数据库的结构和查询最为重要,并在这些索引的基础上构建更为合适的索引,同时它还用于检查是否正确的索引和eventumente mofidicare leggeremente查询以指导索引的使用更为合适。这样做了吗?除此之外,查询时间缩短了。此外,我还将数据库分区到6秒,覆盖索引从10分钟开始。此外,还对我的表进行了活动分区。一些非索引性能注释。适当时,通过执行以下操作减小表的大小:
    notnull
    <代码>字符集ascii;较短的整数(
    TINYINT
    等)<代码>未签名