oracle count条件,【Oracle性能优化】COUNT(*)和COUNT(列)相比较

本文基于 Oracle 11g版本进行演示或许我们平时有这么一些疑问，当你想统计一个查询的总记录数时，第一时间就想到count(*)来实现，但突然又担心该表数据量大时，担心count(*)性能会很差，于是乎，我们可能会使用count(列)进行统计，那到底这两个有什么区别呢？一、当表没有建立索引时1、首先，我们在sqlplus执行下面这个脚本：-- 如果存在，则删除该表DROP TABLE TEST

郁林成森

1001人浏览 · 2021-04-03 06:27:54

郁林成森 · 2021-04-03 06:27:54 发布

本文基于 Oracle 11g版本进行演示

或许我们平时有这么一些疑问，当你想统计一个查询的总记录数时，第一时间就想到count(*)来实现，但突然又担心该表数据量大时，担心count(*)性能会很差，于是乎，我们可能会使用count(列)进行统计，那到底这两个有什么区别呢？

一、当表没有建立索引时

1、首先，我们在sqlplus执行下面这个脚本：

-- 如果存在，则删除该表

DROP TABLE TEST_TABLE;

-- 基于DBA_OBJECTS建立一张测试表,这张表是没有任何主键、外键、索引的

CREATE TABLE TEST_TABLE AS (SELECT * FROM DBA_OBJECTS);

复制代码

我们得到一个TEST_TABLE表，用于我们自己测试，该表派生于DBA_OBJECTS表，注意只有sys用户才能使用这张表，请使用sys进行登录。

2、我们执行两遍下面脚本，对比两个相应指标：

SELECT COUNT(*) FROM TEST_TABLE;

第一次：

CPU开销：281,递归调用：28,一致性读：1097

第二次：

CPU开销：281,递归调用：0,一致性读：1031

这里你会发现，开销一样，但是递归调用居然变成0，一致性读也变少了很多，为什么呢？因为oracle执行完请求之后会将数据缓存到cache中，对应oracle的share pool区域

3、我们执行两遍下面脚本，对比两个相应指标：

SELECT COUNT(OBJECT_ID) FROM TEST_TABLE;

第一次：

CPU开销：281,递归调用：27,一致性读：1097

第二次：

CPU开销：281,递归调用：0,一致性读：1031

你会发现，其实COUNT(*)和COUNT(OBJECT_ID)的效率是一样快的。你可能会不服气，你干嘛选OBJECT_ID作为演示，你干脆换个别的列看看，好的，下面演示别的列：

SELECT COUNT(STATUS) FROM TEST_TABLE;

第一次：

CPU开销：281,递归调用：4,一致性读：1095

第二次：

CPU开销：281,递归调用：0,一致性读：1031

结果还是1031个一致性读，一样快啊~我还是不信，你选择有很多空值的列SUBOBJECT_NAME这个列进行演示吧！好，看下面脚本：

SELECT COUNT(SUBOBJECT_NAME) FROM TEST_TABLE;

第一次：

CPU开销：281,递归调用：4,一致性读：1095

第二次：

CPU开销：281,递归调用：0,一致性读：1031

是吧！还是一样，一致性读都是1031,效率是没有差别的。但是，你发现没有，最后两张图我格外圈了个小圈圈，总条数怎么变成357了呢？不应该是72056行吗？

这是由于COUNT(列)在统计时，对于该列的值若是为null，则不参加计算，这是说明，其实SELECT COUNT(*) FROM TEST_TABLE和SELECT COUNT(列) FROM TEST_TABLE是不等价的，如果你拿SELECT COUNT(列) FROM XXX去完成一个统计表记录数的需求，那GG。

二、当表建立索引时

上面实验证明了，在没有索引的前提下，COUNT(*)和COUNT(列)是没有差别的。假设我们给OBJECT_ID这个列加上一个索引会怎样，执行下面脚本：

CREATE INDEX OBJECT_ID_INDEX ON TEST_TABLE(OBJECT_ID);

然后我们再执行下面脚本：

SELECT COUNT(*) FROM TEST_TABLE;

第二遍：

CPU开销：281,递归调用：0,一致性读：1031

从上图可以看出，即使我们建立了索引，COUNT(*)也不会走索引，反而从执行计划可以看出走了全表扫描TABLE ACCESS FULL，关于执行计划的相关内容，可阅读小编另外一篇文章【Oracle性能优化一】执行计划与索引类型分析

那么此时COUNT(OBJECT_ID)效果如何呢？执行下面脚本：

SELECT COUNT(OBJECT_ID) FROM TEST_TABLE;

CPU开销：45,递归调用：0,一致性读：168

第二遍发现CPU开销和一致性读都变少了很多，而且还走了索引扫描INDEX FAST FULL SCAN,性能确实了得。当然了，这是针对索引列的COUNT(索引列)，非索引列效果如何呢？执行下面脚本：

SELECT COUNT(SUBOBJECT_NAME) FROM TEST_TABLE;

CPU开销：281,递归调用：0,一致性读：1031

发现COUNT(非索引列)没有太大变化。有个小问题，我们那个OBJECT_ID是允许为空的，假设非空会怎样呢？执行下面脚本：

ALTER TABLE TEST_TABLE MODIFY OBJECT_ID NOT NULL;

再执行COUNT(*)和COUNT(列)，结果如下图：

SELECT COUNT(*) FROM TEST_TABLE;

CPU开销：45,递归调用：0,一致性读：168

我们发现COUNT(*)也走索引了，性能也快了很多。

SELECT COUNT(OBJECT_ID) FROM TEST_TABLE;

CPU开销：45,递归调用：0,一致性读：168

而COUNT(列)没有太大变化。

三、特性总结

条件

操作

结果

未建索引

COUNT(*)

全表扫描

未建索引

COUNT(列)

全表扫描

建索引(索引列可以为空)

COUNT(*)

全表扫描

建索引(索引列可以为空)

COUNT(索引列)

索引快速扫描

建索引(索引列可以为空)

COUNT(非索引列)

全表扫描

建索引(索引列不能为空)

COUNT(*)

索引快速扫描

建索引(索引列不能为空)

COUNT(索引列)

索引快速扫描

总结一句话就是，COUNT(*)在有索引且索引非空的情况下才会走索引，同时注意COUNT(*)和COUNT(列)本身是不等价的，使用前先分析业务场景。

当表有索引且索引非空时，COUNT(*)和COUNT(1)和SELECT MAX(ROWNUM) FROM XXX效果是一样的。

下面举一个例子，优化时避免回表操作，当id为非索引列,oper_time为索引列时，有如下SQL：

select count(x.id) as countnum

from iodso.A x

where x.oper_time between 1 and 2;

复制代码

上述sql会导致回表操作，由于我们只需要统计条数，此时我们可以使用count(*)反而性能更高，因为直接从索引内存就可以统计条数，不用再TABLE ACCESS BY ROWID了，不要使用Count(非索引列)的方式，所以我们要避免上述错误。

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

【计算机视觉】Pixel逐像素分类&Mask掩码分类理解摘要

魔乐社区

计算机视觉（opencv）实战三十二——CascadeClassifier 人脸微笑检测（摄像头）

本文从原理到实现，详细介绍了基于 OpenCV Haar 分类器的人脸与微笑检测：讲解了 Haar 特征和级联检测原理。对代码逐行拆解并解释参数含义。画出完整流程图，帮助理解执行过程。给出了常见问题和优化建议，甚至扩展到深度学习方法。这种方法简单、轻量、实时性好，非常适合入门和小型应用项目。但如果需要更高准确率和更强鲁棒性，建议使用深度学习检测器替代 Haar 分类器。