MySQL存储引擎对比
作者:尹正杰
版权声明:原创作品,谢绝转载!否则将追究法律责任。
一.MySQL的存储引擎
大家应该知道MySQL的存储引擎应该是表级别的概念,因为我们无法再创建database时指定存储引擎,而是只能在创建表的时候可以明确指定使用哪种存储引擎。因此存储引擎也通常被称作“表类型”。也就是说,存储引擎是负责跟文件系统真正数据打交道的工具,它却决定了表中是如何存储数据的,不用存储引擎他们指出的工作特性是各不相同的。所以,我们在工作时应该选择时候适合自己的存储引擎。
1>.查看MySQL支持的所有存储引擎
1 mysql> show engines; 2 +------------+---------+------------------------------------------------------------+--------------+------+------------+ 3 | Engine | Support | Comment | Transactions | XA | Savepoints | 4 +------------+---------+------------------------------------------------------------+--------------+------+------------+ 5 | MRG_MYISAM | YES | Collection of identical MyISAM tables | NO | NO | NO | 6 | CSV | YES | CSV storage engine | NO | NO | NO | 7 | MyISAM | DEFAULT | Default engine as of MySQL 3.23 with great performance | NO | NO | NO | 8 | InnoDB | YES | Supports transactions, row-level locking, and foreign keys | YES | YES | YES | 9 | MEMORY | YES | Hash based, stored in memory, useful for temporary tables | NO | NO | NO |10 +------------+---------+------------------------------------------------------------+--------------+------+------------+11 5 rows in set (0.00 sec)12 13 mysql>
2>.查看某张表的存储引擎
使用格式: SHOW TABLE STATUS [{FROM | IN} db_name] [LIKE 'pattern' | WHERE expr]
1 mysql> show table status in yinzhengjie like 'students'\G #我们可以用like来过滤 2 *************************** 1. row *************************** 3 Name: students -------->表名 4 Engine: InnoDB ------->存储引擎 5 Version: 10 -------->版本 6 Row_format: Compact -------->行格式 7 Rows: 11 -------->现存表中的行数,对于InnoDB的存储引擎的话这个数字可能只是一个估计值,因为innodb支持事物,其中还保存着删除的行数。 8 Avg_row_length: 1489 --------->平均每行所包含的字节数 9 Data_length: 16384 --------->表中数据总体大小,单位是字节10 Max_data_length: 0 --------->表能够占用的最大空间,单位为字节。注意,“0”则表示没有上线哟!11 Index_length: 16384 --------->索引的大小,单位也是字节12 Data_free: 4194304 ---------->对于MyISAM表,表示已经分配但尚未使用的空间,其中包含此前删除行之后腾出来的空间。13 Auto_increment: 13 ----------->下一个AUTO_INCREMENT的值14 Create_time: 2017-11-20 03:57:26 ----------->表的创建时间15 Update_time: NULL ----------->表数据的最后一次修改时间16 Check_time: NULL ------------>使用CHECK TABLE或myisamchk最近一次检查表的时间17 Collation: utf8_general_ci ------------->排序规则18 Checksum: NULL ------------->如果启动,则为表的checksum19 Create_options: ------------->创建表时指定使用的其他选项20 Comment: ------------->表的注释信息21 1 row in set (0.00 sec)22 23 mysql> show table status in yinzhengjie where name='students'\G #当然用where查询的性能会更好哟!24 *************************** 1. row ***************************25 Name: students26 Engine: InnoDB27 Version: 1028 Row_format: Compact29 Rows: 1130 Avg_row_length: 148931 Data_length: 1638432 Max_data_length: 033 Index_length: 1638434 Data_free: 419430435 Auto_increment: 1336 Create_time: 2017-11-20 03:57:2637 Update_time: NULL38 Check_time: NULL39 Collation: utf8_general_ci40 Checksum: NULL41 Create_options: 42 Comment: 43 1 row in set (0.00 sec)44 45 mysql>
3>.行格式
MySQL的行格式有:{DEFAULT|DYNAMIC|FIXED|COMMPRESSED|REDUNDANT|COMPACT},其中DYNAMIC|FIXED|COMMPRESSED是MyISAM常用的的,而InnoDB即可以使用MyISAM常用的类型还可以使用REDUNDANT|COMPACT等等。
二.MyISAM和InnoDB的存储引擎对比
1>.什么是表空间(table space)
它是由InnoDB管理的特有格式数据文件,内部可同时存储数据和索引。
2>.MyISAM数据存储结果
MySQL的每个表都在数据库目录下存储三个文件,名称如下:
a>.tb_name.frm #存储表结构
b>.tb_name.MYD #存储数据
c>.tb_name.MYI #存储索引
3>.InnoDB
Innodb有两种格式:
a>.innodb_file_per_table=OFF,即是用共享表空间
每个表一个独有的格式定义文件:tb_name.frm
还有一个默认位于数据目录下的共享的表空间文件:ibdata#(它是会自动增长的,比如ibdata1,ibdata2,...)
b>.innodb_file_per_table=ON,即是用独立表空间
每个表在数据库目录下存储两个文件
tb_name.frm #存储表结构
tb_name.ibd #存储数据
4>.修改默认的存储引擎
通过default_storage_engine服务变量实现。可以用mysql> show variables like '%default%'来查看相应的信息。
三.MySQL各存储引擎的特性
1>.InnoDB存储引擎
a>.支持事务:
有事务日志,这些事物日志文件的大小是一致的哟!):ib_logfile#(例如:ib_logfile0,ib_logfile1,....);
b>.支持外键约束;
c>.支持MVCC(多版本并发控制);
d>.支持聚簇索引:
聚簇索引之外的其他索引,通常称之为辅助索引,一张表聚簇索引只能有一个而辅助索引可以有多个。聚簇索引通常是用主键的方式来实现,(因为主键的数据是不允许重复的);
e>.行级锁:间隙锁;
f>.支持使用辅助索引;
g>.支持自适应的hash索引;
h>.支持热备份,因此数据不需要离线就可以完成备份啦,当然可能要用独立表空间;
2>.MyISAM
MyISAM的使用场景:只读数据,表较小,能够忍受崩溃后的修复操作和数据丢失,它具有一下特点:
a>.全文索引
b>.支持表压缩存放:做数据仓库,能节约存储空间并提升性能
c>.支持空间索引
d>.表级锁
e>.延迟更新索引
f>.不支持事务、外键和行级锁
g>.崩溃后无法安全恢复数据
MySQL的mysql库使用就是MyISAM存储引擎,我们可以使用“mysql> show table status in mysql\G”进行查看。
3>.ARCHIVE(归档)
仅支持INSERT和SELECT,支持很好压缩功能。应用于存储日志信息,或其他按照时间序列实现的数据采集类的应用。 它不支持事物,不能很好的支持索引。
4>.CSV
将数据存储为CSV格式,不支持索引,仅使用与数据交换场景。说白了就是可以在多种不同的数据库之间来回导入导出数据库的。也就是说我们可以将office的文档保存为CSV就可以直接向MySQL数据库导入哟。
5>.BLACKHOLE
又名黑洞存储引擎,没有存储机制,任何发往次引擎的数据都会丢弃,其会记录二进制日志,因此,常用于多级复制架构中作中转服务器。
6>.MEMORY
保存数据在内存中,它是一个内存表(也就是说重启操作系统之后就会丢失该表的数据哟!);常用于保存中间数据,如周期性的聚合数据等,也用于实现临时表,支持hash索引,使用表级锁,不支持BLOB和TEXT数据类型。
7>.MRG_MYISAM
是MYISAM的一个变种,能够将多个MyISAM表合并成一个虚表。它是传统的MySQL存储引擎,现在基本上很少有人用了,因为一个表的数据内容本来就很大了,人们更多考虑的是如何将一张表的内容如何拆分开来。
8>NDB
是MySQL CLUSTER中专用的存储引擎。它是集群用的一种存储引擎,但是这种集群用的几乎寥寥无几。
四.第三方的存储引擎
在线存储引(简称,OLPT),常见的有以下三种:
1>.XtraDB
它是增强的InnoDB,有Percona提供。
编译安装时,下载XtraDB的源码替代MySQL存储引擎中的InnoDB的源码(当然你得把XtraDB的名称改为InnoDB哟)
2>.PBXT:
MariaDB自带此存储引擎
支持引擎级别的复制、外键约束,对SSD磁盘(固态磁盘)提供适当支持,当然也支持事务和MVCC等等。
3>.TokuDB:
使用 Fractal Trees索引,适用存储大数据,拥有很好的压缩比,已经被引入MariaDB。
按照列式数据存储引擎分为以下几种4种:
4>.Infobright
目前较有名的列式引擎,适用于海量数据存储场景,如PB级别,专为数据分析和数据仓库设计,分为商业版本和社区版本,其他三个都不是特别有名。
5>.InfiniDB
6>.MonetDB
7>.LucidDB
按照开源社区存储引擎分为以下几种:
8>.Aria:前身为Maria,是增强版的MyISAM(支持崩溃后安全恢复,支持数据缓存)
9>.Groona:全文索引引擎
10>.Mroonga:是基于Groona的二次开发版
11>.OQGraph:由open query研发,支持图(网状 )结构的存储引擎
12>.SphinxSE:为Sphinx全文搜索服务器提供了SQL接口
13>.Spider:能将数据切分成不同的分片,比较高效透明的实现了分片(shared),并支持在分片上支持并行查询
五.如何选择合适的存储引擎
我们一般从以下几个维度衡量:
1>.是否需要事务;
2>.备份的类型的支持;
3>.崩溃后的恢复;
4>.特有的特性;