Hadoop Cloudera Impala性能测试-空缓存

Hadoop Cloudera Impala性能测试-空缓存,hadoop,cloudera,impala,Hadoop,Cloudera,Impala,我尝试在cloudera hadoop集群上执行性能测试。然而,只要Impala使用缓存来存储以前的查询,我如何清空缓存 黑斑羚是否使用缓存? Impala不缓存数据,但缓存一些表和文件元数据。尽管查询在后续迭代中可能运行得更快,因为数据集缓存在OS缓冲区缓存中,但Impala并没有显式地控制这一点 引用自:文件元数据缓存不同于“查询缓存”。它只是在HDFS中缓存文件和块的位置,这是大多数数据库已经知道的,但Impala可能不知道,因为它从配置单元获取表/文件元数据。在测试中,Impala应该可

我尝试在cloudera hadoop集群上执行性能测试。然而,只要Impala使用缓存来存储以前的查询,我如何清空缓存

黑斑羚是否使用缓存? Impala不缓存数据,但缓存一些表和文件元数据。尽管查询在后续迭代中可能运行得更快,因为数据集缓存在OS缓冲区缓存中,但Impala并没有显式地控制这一点

引用自:

文件元数据缓存不同于“查询缓存”。它只是在HDFS中缓存文件和块的位置,这是大多数数据库已经知道的,但Impala可能不知道,因为它从配置单元获取表/文件元数据。在测试中,Impala应该可以使用文件元数据

Impala从不缓存查询,但可以通过以下两种方式之一缓存文件数据:

  • 你已经启用了。我想你不会这么做的
  • HDFS读取的某些数据可能位于操作系统缓冲区缓存中。黑斑羚无法控制这一切。一些谷歌搜索提供了关于清除Linux缓冲区缓存的指导,例如