1.索引的基本原理
索引用来快速地寻找那些具有特定值的记录。如果没有索引,一般来说执行查询时遍历整张表。
索引的原理:就是将无序的数据变成有序的查询。
1.把创建了索引的列的内容进行排序;
2.对排序结果生成倒排表
3.在倒排表内容上拼上数据地址链;
4.在查询的时候,先拿到倒排表内容, 数据地址链,从而拿到具体数据。
例如:Hash索引就是将要查询的key数据经过hash函数映射,定位出具体要查询的数据存储位置。注意用户需要查询的数据本身在内容中是无序存放,但是经过hash函数的映射就会将对应的数据位置变为有序的存储
MySQL底层的索引就是采用B+树,所谓B数就是m叉排序树,是二叉排序树的拓展,即一个节点最多有m-1个元素,最多有m个分叉。B-树的每个节点都有data域(指针),增大了节点大小,增大了磁盘IO次数。B+树除了叶节点其他节点不存储数据,节点小,磁盘IO次数少。即B+树只有叶节点存放数据,其余节点做索引,B-树每个索引节点都有data域,因此B+树可以存储更多索引。
2.MySQL聚簇索引和非聚簇索引索引的区别
聚簇索引:
很简单一句话,找到了索引就找到了需要的数据,那么这个索引就是聚簇索引,因此主键就是聚簇索引,修改聚簇索引其实就是修改主键。
非聚簇索引:
索引的存储和数据的存储是分离的,也就是说找到了索引但没完全找到数据,需要根据索引上的值(主键)再次回表查询,非聚簇索引也叫做辅助索引。
简单举一个例子:
下面我们创建一个学生表,做两种查询,分别说明什么情况下是聚簇索引,什么情况下是非聚簇索引。
CREATE TABLE student(
id INT PRIMARY KEY,#学号
`name` VARCHAR(10) UNIQUE,#姓名
score DOUBLE,#分数
teacher VARCHAR(10)#老师
)
第一种,直接根据主键查询获取所有字段数据,此时主键是聚簇索引,因为主键对应的索引叶子节点存储了id=1的所有字段的值;
SELECT * FROM student WHERE id=1
第二种,根据学生姓名查询获取所有字段数据,当查询到对应的姓名索引后,该索引节点的数据存储的是主键id,如果要查询所有的字段信息,还需要根据主键id重新查询一次获取对应的全部字段数据,所以这种查询下name不是聚簇索引。
SELECT * FROM student WHERE name='Nancy'