关于区分度不高的字段,比如性别,比如状态字段,是否应该建索引?

只有2种取值的字段,建了索引数据库也不一定会用,只会白白增加索引维护的额外开销,因为索引也是需要存储的,所以插入和更新的写入操作,同时需要插入和更新你这个字段的索引的.

所以说,唯一性太差的字段不需要创建索引,即便用于where条件.

相关,建立联合索引时,也要考虑把重复率低而又用得多的列放在前面.

比如: key (attr_id, attr_value)

联合索引左匹配:单查 attr_id 也能使用索引,单查 attr_value 将无法利用该联合索引.

那么把区分度不高(唯一性不高)的字段和区分度高的字段(唯一性高)的字段一起做联合索引呢?

看情况,举个例子,如果仅仅是男女,数据55开的,或者是只有1,2,3三种状态的且相对平均分布的,这种情况下索引是没用的(用不到的)

如果可以根据筛选条件过滤出来一个小的结果集,当然可以建索引

比如表中状态位有1,2,3,4,5,6,7,8,9等等,3,4,5,6,7,8,9占据了大部分数据,1,2只有少部分数据,当然可以在这个字段上建索引

对于3,4,5,6,7,8,9的查询可能不适用与索引查询,但是对于1,2就适合索引查找,那么此时建立个索引页无可厚非。

这种情况,应该和其他的查询条件用到的字段,建立联合索引,而不是建立单列索引;

比如这样的查询比较多:

select * from t where crdate > '2017-01-01' and sexid = '男'

可以建立如下索引:

create  index ix_t on t(crdate, sexid)

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐