综上所述,日期这块类型的选择遵循以下原则:
1. 如果时间有可能超过时间戳范围,优先选择 datetime。
2. 如果需要单独获取年份值,比如按照年来分区,按照年来检索等,最好在表中添加一个 year 类型来参与。
3. 如果需要单独获取日期或者时间,最好是单独存放,而不是简单的用 datetime 或者 timestamp。后面检索时,再加函数过滤,以免后期增加 SQL 编写带来额外消耗。
4. 如果有保存毫秒类似的需求,最好是用时间类型自己的特性,不要直接用字符类型来代替。MySQL 内部的类型转换对资源额外的消耗也是需要考虑的。
示例 5
建立表 t5,对这些可能需要的字段全部分离开,这样以后写 SQL 语句的时候就很容易了。
mysql-(ytt/3305)->create table t5 (c1 date,c2 datetime(3),c3 timestamp(3),c4 time(3),c5 year);
Query OK, 0 rows affected (1.01 sec)
mysql-(ytt/3305)->set @a='2018-03-25 12:22:33.342';
Query OK, 0 rows affected (0.00 sec)
mysql-(ytt/3305)->insert into t5 values (date(@a), @a,@a,time(@a),year(@a));
Query OK, 1 row affected (0.01 sec)
mysql-(ytt/3305)->select * from t5;
+------------+-------------------------+-------------------------+--------------+------+
| c1 | c2 | c3 | c4 | c5 |
+------------+-------------------------+-------------------------+--------------+------+
| 2018-03-25 | 2018-03-25 12:22:33.342 | 2018-03-25 12:22:33.342 | 12:22:33.342 | 2018 |
+------------+-------------------------+-------------------------+--------------+------+
当然了,这种情形占用额外的磁盘空间。如果想在易用性与空间占用量大这两点来折中,可以用 MySQL 的虚拟列来实时计算。比如假设 c5 字段不存在,想要得到 c5 的结果。
mysql-(ytt/3305)->alter table t5 drop c5, add c5 year generated always as (year(c1)) virtual;
Query OK, 1 row affected (2.46 sec)
Records: 1 Duplicates: 0 Warnings: 0
五、二进制类型
binary 和 varbinary 对应了 char 和 varchar 的二进制存储,相关的特性都一样。不同的有以下几点:
示例 6
来看这个 binary 存取的简单示例,还是之前的变量 @a。
切记!这里要提前计算好 @a 占用的字节数,以防存储溢出。
mysql-(ytt/3305)->set @a = "我是傻傻的小月亮!!!!";
Query OK, 0 rows affected (0.00 sec)
mysql-(ytt/3305)->create table t6 (c1 binary(28),c2 varbinary(28));
Query OK, 0 rows affected (0.03 sec)
mysql-(ytt/3305)->insert into t6 values (@a,@a);
Query OK, 1 row affected (0.01 sec)
mysql-(ytt/3305)->select * from t6;
+------------------------------+------------------------------+
| c1 | c2 |
+------------------------------+------------------------------+
| 我是傻傻的小月亮!!!! | 我是傻傻的小月亮!!!! |
+------------------------------+------------------------------+
1 row in set (0.00 sec)
六、位类型
bit 为 MySQL 里存储比特位的类型,最大支持 64 比特位, 直接以二进制方式存储,一般用来存储状态类的信息。比如,性别,真假等。具有以下特性:
1. 对于 bit(8) 如果单纯存放 1 位,左边以 0 填充 00000001。
2. 查询时可以直接十进制来过滤数据。
3. 如果此字段加上索引,MySQL 不会自己做类型转换,只能用二进制来过滤。
示例 7
创建表 c1, 字段性别定义一个比特位。
mysql-(ytt/3305)->create table c1(gender bit(1));
Query OK, 0 rows affected (0.02 sec)
插入两条记录
mysql-(ytt/3305)->insert into c1 values (b'0');
Query OK, 1 row affected (0.01 sec)
mysql-(ytt/3305)->insert into c1 values (b'1');
Query OK, 1 row affected (0.00 sec)
检索数据,直接以十进制方式显示。
mysql-(ytt/3305)->select gender+0 'f1' from c1;
+------+
| f1 |
+------+
| 0 |
| 1 |
+------+
2 rows in set (0.01 sec)
也可以用类型显示转换。
mysql-(ytt/3305)->select cast(gender as unsigned) 'f1' from c1;
+------+
| f1 |
+------+
| 0 |
| 1 |
+------+
2 rows in set (0.00 sec)
过滤数据也一样,二进制或者直接十进制都行。
mysql-(ytt/3305)->select conv(gender,16,10) as gender
-> from c1 where gender = b'1';
+--------+
| gender |
+--------+
| 1 |
+--------+
1 row in set (0.00 sec)
mysql-(ytt/3305)->select conv(gender,16,10) as gender
-> from c1 where gender = '1';
+--------+
| gender |
+--------+
| 1 |
+--------+
1 row in set (0.00 sec)
其实这样的场景,也可以定义为 char(0),这也是类似于 bit 非常优化的一种用法。
mysql-(ytt/3305)->create table c2(gender char(0));
Query OK, 0 rows affected (0.03 sec)
那现在我给表 c1 简单的造点测试数据。
mysql-(ytt/3305)->select count(*) from c1;
+----------+
| count(*) |
+----------+
| 33554432 |
+----------+
1 row in set (1.37 sec)
把 c1 的数据全部插入 c2。
mysql-(ytt/3305)->insert into c2 select if(gender = 0,'',null) from c1;
Query OK, 33554432 rows affected (2 min 18.80 sec)
Records: 33554432 Duplicates: 0 Warnings: 0
两张表的磁盘占用差不多。
root@ytt-pc:/var/lib/mysql/3305/ytt# ls -sihl
总用量 1.9G
4085684 933M -rw-r----- 1 mysql mysql 932M 12月 11 10:16 c1.ibd
4082686 917M -rw-r----- 1 mysql mysql 916M 12月 11 10:22 c2.ibd
检索方式稍微有些不同,不过效率也差不多。所以说,字符类型不愧为万能类型。
mysql-(ytt/3305)->select count(*) from c1 where gender = 0;
+----------+
| count(*) |
+----------+
| 16772213 |
+----------+
1 row in set (12.03 sec)
mysql-(ytt/3305)->select count(*) from c2 where gender = '';
+----------+
| count(*) |
+----------+
| 16772213 |
+----------+
1 row in set (12.53 sec)
七、枚举类型
枚举类型,也即 enum。适合提前规划好了所有已经知道的值,且未来最好不要加新值的情形。枚举类型有以下特性:
1. 最大占用 2 Byte。
2. 最大支持 65535 个不同元素。
3. MySQL 后台存储以下标的方式,也就是 tinyint 或者 smallint 的方式,下标从 1 开始。
4. 排序时按照下标排序,而不是按照里面元素的数据类型。所以这点要格外注意。
示例 8
创建表 t7。
mysql-(ytt/3305)->create table t7(c1 enum('mysql','oracle','dble','postgresql','mongodb','redis','db2','sql server'));
Query OK, 0 rows affected (0.03 sec)
用下标插入数据。
mysql-(ytt/3305)->insert into t7 values (1);
Query OK, 1 row affected (0.40 sec)
mysql-(ytt/3305)->insert into t7 values (2);
Query OK, 1 row affected (0.00 sec)
用真实元素插入数据。
mysql-(ytt/3305)->insert into t7 values ('postgresql');
Query OK, 1 row affected (0.01 sec)
mysql-(ytt/3305)->insert into t7 values ('dble');
Query OK, 1 row affected (0.01 sec)
mysql-(ytt/3305)->insert into t7 values ('sql server');
查询结果出来,发现是按照之前定义的元素排序,也就是下标排序。
mysql-(ytt/3305)->select * from t7 order by c1;
+------------+
| c1 |
+------------+
| mysql |
| oracle |
| dble |
| postgresql |
| sql server |
+------------+
5 rows in set (0.00 sec)
八、集合类型
集合类型 SET 和枚举类似,也是得提前知道有多少个元素。SET 有以下特点:
1. 最大占用 8 Byte,int64。
2. 内部以二进制位的方式存储,对应的下标如果以十进制来看,就分别为 1,2,4,8,…,pow(2,63)。
3. 最大支持 64 个不同的元素,重复元素的插入,取出来直接去重。
4. 元素之间可以组合插入,比如下标为 1 和 2 的可以一起插入,直接插入 3 即可。
示例 9
定义表 c7 字段 c1 为 set 类型,包含了 8 个值,也就是下表最大为 pow(2,7)。
mysql-(ytt/3305)->create table c7(c1 set('mysql','oracle','dble','postgresql','mongodb','redis','db2','sql server'));
Query OK, 0 rows affected (0.02 sec)
插入 1 到 128 的所有组合。
mysql-(ytt/3305)->INSERT INTO c7
WITH RECURSIVE ytt_number (cnt) AS (
SELECT 1 AS cnt
UNION ALL
SELECT cnt + 1
FROM ytt_number
WHERE cnt < pow(2, 7)
)
SELECT *
FROM ytt_number;
Query OK, 128 rows affected (0.01 sec)
Records: 128 Duplicates: 0 Warnings: 0
查询的时候也是直接用下标或者元素来查。
mysql-(ytt/3305)->select * from c7 where c1 = 1;
+-------+
| c1 |
+-------+
| mysql |
+-------+
1 row in set (0.00 sec)
mysql-(ytt/3305)->select * from c7 where c1 = 'mysql';
+-------+
| c1 |
+-------+
| mysql |
+-------+
1 row in set (0.00 sec)
九、数据类型在存储函数中的用法
函数里除了显式声明的变量外,默认 session 变量的数据类型很弱,随着给定值的不同随意转换。
示例 10
定义一个函数,返回两个给定参数的乘积。定义里有两个变量,一个是 v_tmp 显式定义为 int64,另外一个 @vresult 随着给定值的类型随意变换类型。
DELIMITER $$
CREATE DEFINER=`ytt`@`127.0.0.1` FUNCTION `ytt_sample_data_type`(`f1` INT, `f2` INT) RETURNS varchar(100) CHARSET latin1
NO SQL
begin
declare v_tmp bigint default 0;
set v_tmp = f1 * f2;
set @v_result = concat('The result is: ''',v_tmp,'''.');
return @v_result;
end$$
DELIMITER ;
简单调用下。
mysql-(ytt/3305)->select ytt_sample_data_type(1111,222) 'result';
+--------------------------+
| result |
+--------------------------+
| The result is: '246642'. |
+--------------------------+
1 row in set (0.00 sec)
总结
本篇把 MySQL 基本的数据类型做了简单的介绍,并且用了一些容易理解的示例来梳理这些类型。我们在实际场景中,建议选择适合最合适的类型,不建议所有数据类型简单的最大化原则。比如能用 varchar(100),不用 varchar(1000)。
关于 MySQL 的技术内容,你们还有什么想知道的吗?赶紧留言告诉小编吧!
想看更多技术好文,点个“在看”吧!
原创文章,作者:筱凯,如若转载,请注明出处:https://www.jingyueyun.com/ask/201.html