Postgresql 理解表膨胀查询
在研究表膨胀时,在很多地方都会出现这种查询 我正在努力破解这个问题,以免盲目依赖它 这里的27或23有什么特别之处?windows和非windows安装之间的区别是提供值4或8 当“8.0”、“8.1”、“8.2”中的子字符串v、12,3和27其他23 以hdr结尾, 当v~'mingw32'然后8其他4结束为ma时的情况 有人能对这一问题提供一些见解吗 使用pgstattuple是计算表膨胀的更明智的方法吗 谢谢Postgresql 理解表膨胀查询,postgresql,Postgresql,在研究表膨胀时,在很多地方都会出现这种查询 我正在努力破解这个问题,以免盲目依赖它 这里的27或23有什么特别之处?windows和非windows安装之间的区别是提供值4或8 当“8.0”、“8.1”、“8.2”中的子字符串v、12,3和27其他23 以hdr结尾, 当v~'mingw32'然后8其他4结束为ma时的情况 有人能对这一问题提供一些见解吗 使用pgstattuple是计算表膨胀的更明智的方法吗 谢谢 SELECT tablename AS relname, sch
SELECT
tablename AS relname, schemaname,
(ROUND((CASE WHEN otta=0 THEN 0.0 ELSE sml.relpages::FLOAT/otta END)::NUMERIC,1))::BIGINT AS tbloat,
(CASE WHEN relpages < otta THEN 0 ELSE bs*(sml.relpages-otta)::BIGINT END)::BIGINT AS wastedbytes
FROM (
SELECT
schemaname, tablename, cc.reltuples, cc.relpages, bs,
CEIL((cc.reltuples*((datahdr+ma-
(CASE WHEN datahdr%ma=0 THEN ma ELSE datahdr%ma END))+nullhdr2+4))/(bs-20::FLOAT)) AS otta
FROM (
SELECT
ma,bs,schemaname,tablename,
(datawidth+(hdr+ma-(CASE WHEN hdr%ma=0 THEN ma ELSE hdr%ma END)))::NUMERIC AS datahdr,
(maxfracsum*(nullhdr+ma-(CASE WHEN nullhdr%ma=0 THEN ma ELSE nullhdr%ma END))) AS nullhdr2
FROM (
SELECT
schemaname, tablename, hdr, ma, bs,
SUM((1-null_frac)*avg_width) AS datawidth,
MAX(null_frac) AS maxfracsum,
hdr+(
SELECT 1+COUNT(*)/8
FROM pg_stats s2
WHERE null_frac<>0 AND s2.schemaname = s.schemaname AND s2.tablename = s.tablename
) AS nullhdr
FROM pg_stats s, (
SELECT
(SELECT current_setting('block_size')::NUMERIC) AS bs,
CASE WHEN SUBSTRING(v,12,3) IN ('8.0','8.1','8.2') THEN 27 ELSE 23 END AS hdr,
CASE WHEN v ~ 'mingw32' THEN 8 ELSE 4 END AS ma
FROM (SELECT version() AS v) AS foo
) AS constants
GROUP BY 1,2,3,4,5
) AS foo
) AS rs
JOIN pg_class cc ON cc.relname = rs.tablename
JOIN pg_namespace nn ON cc.relnamespace = nn.oid AND nn.nspname = rs.schemaname AND nn.nspname <> 'information_schema'
) AS sml
WHERE schemaname != 'pg_catalog'
order by 4 desc
您想知道的片段使用了数据库的版本:
... FROM (SELECT version() AS v)
根据PostgreSQL版本的不同,查询会产生不同的结果
我对这个问题的体验是复杂的。有时它会给出一个好的猜测,有时它是错误的
我建议你不要用它。监视数据库的存储大小,如果发现异常增长,请使用pgstattuple查找可疑表的实际膨胀量。您想知道的片段使用的是数据库版本:
... FROM (SELECT version() AS v)
根据PostgreSQL版本的不同,查询会产生不同的结果
我对这个问题的体验是复杂的。有时它会给出一个好的猜测,有时它是错误的
我建议你不要用它。监视数据库的存储大小,如果发现异常增长,请使用pgstattuple查找可疑表的实际膨胀量。27和23是不同版本PostgreSQL中每个行标题使用的字节数。除了正确回答PostgreSQL版本中每行标题使用了多少字节之外,它们没有什么特别之处。我欣赏对细节的关注,但是如果27和23之间的差异对得出的结论有任何影响,我认为你太关注你的肚脐绒布了 ma用于内存对齐。mingw32是在Windows上编译的特定编译器。这不是唯一一个在Windows上使用,事实上,是非常罕见的,因为我可以说,Visual C++是非常常见的。几乎任何64位系统都会有8字节对齐,如果使用较新版本的查询,就会发现这一点。如果您想要一个更为最新的版本,您可能应该从
pgstattuple的速度要慢得多,但更精确,因为它实际上检查每个元组,而不是依赖于统计数据收集系统。但就我而言,除非您已经认为可能存在膨胀问题,否则这些都没有多大意义。27和23是不同版本PostgreSQL中每个行标题使用的字节数。除了正确回答PostgreSQL版本中每行标题使用了多少字节之外,它们没有什么特别之处。我欣赏对细节的关注,但是如果27和23之间的差异对得出的结论有任何影响,我认为你太关注你的肚脐绒布了 ma用于内存对齐。mingw32是在Windows上编译的特定编译器。这不是唯一一个在Windows上使用,事实上,是非常罕见的,因为我可以说,Visual C++是非常常见的。几乎任何64位系统都会有8字节对齐,如果使用较新版本的查询,就会发现这一点。如果您想要一个更为最新的版本,您可能应该从
pgstattuple的速度要慢得多,但更精确,因为它实际上检查每个元组,而不是依赖于统计数据收集系统。但就我而言,除非你已经认为自己可能有腹胀问题,否则这些都没有多大意义。消息来源已披露谢谢。消息来源已披露谢谢。