mysql 数据量大加了索引聚类查询还是慢

2025-03-23 22:10:54

推荐回答（2个）

回答（1）：

　　可以根据条件去添加索引，
　　一、
　　所有mysql索引列类型都可以被索引，对来相关类使用索引可以提高select查询性能，根据mysql索引数，可以是最大索引与最小索引，每种存储引擎对每个表的至少支持16的索引。总索引长度为256字节。
　　mysim和innodb存储引擎的表默认创建索引都是btree索引，目前mysql还不支持函数索引，但支持前缘索引，对字段前N个字符创建索引
　　二、mysql创建索引语法
　　Create [unioun|fulltext|spatial] index indexname[using indextype] on tablename( tablenamecol)
　　index_col_name:
　　col_name[ (length)][asc |desc]
　　如果你创建索引时搞错了，需要修改mysql索引我们可以用alert来修改索引，语法与create index创建索引差不多，我们就不说了，可以查看相关手册。
　　下面我们来看一个关于mysql创建索引实例教程。
　　mysql>create index cityname on city(city(2));
　　Query Ok,600 rows affected (0.26 sec)
　　Records :600 Duplicates:0 Warings 0:
　　我们现在来以city为条件进行查询，如下面。
　　->explain select * from city where city ='www.111cn.net' G
　　id:1
　　......
　　possible_keys:cityname
　　key:cityname
　　好了，现在我们来看看mysql删除索引等实例
　　Drop indexname on tablename
　　实例，我现在要删除刚才创建city索引
　　>drop index cityname on city;
　　Query ok, .....
　　不过通常对百万级数据的查询或者其他操作，都改换其他的大型的数据库了

回答（2）：

1. 执行计划中明明有使用到索引，为什么执行还是这么慢？

2. 执行计划中显示扫描行数为 644，为什么 slow log 中显示 100 多万行？
a. 我们先看执行计划，选择的索引 “INDX_BIOM_ELOCK_TASK3(TASK_ID)”。结合 sql 来看，因为有 "ORDER BY TASK_ID DESC" 子句，排序通常很慢，如果使用了文件排序性能会更差，优化器选择这个索引避免了排序。
那为什么不选 possible_keys:INDX_BIOM_ELOCK_TASK 呢？原因也很简单，TASK_DATE 字段区分度太低了，走这个索引需要扫描的行数很大，而且还要进行额外的排序，优化器综合判断代价更大，所以就不选这个索引了。不过如果我们强制选择这个索引（用 force index 语法），会看到 SQL 执行速度更快少于 10s，那是因为优化器基于代价的原则并不等价于执行速度的快慢；
b. 再看执行计划中的 type:index，"index" 代表 “全索引扫描”，其实和全表扫描差不多，只是扫描的时候是按照索引次序进行而不是行，主要优点就是避免了排序，但是开销仍然非常大。
Extra:Using where 也意味着扫描完索引后还需要回表进行筛选。一般来说，得保证 type 至少达到 range 级别，最好能达到 ref。
在第 2 点中提到的“慢日志记录Rows_examined: 1161559，看起来是全表扫描”，这里更正为“全索引扫描”，扫描行数确实等于表的行数；
c. 关于执行计划中：“rows：644”，其实这个只是估算值，并不准确，我们分析慢 SQL 时判断准确的扫描行数应该以 slow log 中的 Rows_examined 为准。
4. 优化建议：添加组合索引 IDX_REL_DEVID_TASK_ID(REL_DEVID,TASK_ID)

优化过程：
TASK_DATE 字段存在索引，但是选择度很低，优化器不会走这个索引，建议后续可以删除这个索引：
select count(*),count(distinct TASK_DATE) from T_BIOMA_ELOCK_TASK;+------------+---------------------------+| count(*) | count(distinct TASK_DATE) |+------------+---------------------------+| 1161559 | 223 |+------------+---------------------------+

在这个 sql 中 REL_DEVID 字段从命名上看选择度较高，通过下面 sql 来检验确实如此：
select count(*),count(distinct REL_DEVID) from T_BIOMA_ELOCK_TASK;+----------+---------------------------+| count(*) | count(distinct REL_DEVID) |+----------+---------------------------+| 1161559 | 62235 |+----------+---------------------------+

由于有排序，所以得把 task_id 也加入到新建的索引中，REL_DEVID,task_id 组合选择度 100%：
select count(*),count(distinct REL_DEVID,task_id) from T_BIOMA_ELOCK_TASK;+----------+-----------------------------------+| count(*) | count(distinct REL_DEVID,task_id) |+----------+-----------------------------------+| 1161559 | 1161559 |+----------+-----------------------------------+

在测试环境添加 REL_DEVID，TASK_ID 组合索引，测试 sql 性能：alter table T_BIOMA_ELOCK_TASK add index idx_REL_DEVID_TASK_ID(REL_DEVID,TASK_ID);
添加索引后执行计划：
这里还要注意一点“隐式转换”：REL_DEVID 字段数据类型为 varchar，需要在 sql 中加引号：AND T.REL_DEVID = 000000025xxx >> AND T.REL_DEVID = '000000025xxx'

执行时间从 10s+ 降到毫秒级别：
1 row in set (0.00 sec)
结论
一个典型的 order by 查询的优化，添加更合适的索引可以避免性能问题：执行计划使用索引并不意味着就能执行快。

mysql 数据量大 加了索引 聚类查询还是慢

mysql 数据量大加了索引聚类查询还是慢