@@ -3,30 +3,43 @@ title: MySQL日期类型选择建议
3
3
category : 数据库
4
4
tag :
5
5
- MySQL
6
+ head :
7
+ - - meta
8
+ - name : keywords
9
+ content : MySQL 日期类型选择, MySQL 时间存储最佳实践, MySQL 时间存储效率, MySQL DATETIME 和 TIMESTAMP 区别, MySQL 时间戳存储, MySQL 数据库时间存储类型, MySQL 开发日期推荐, MySQL 字符串存储日期的缺点, MySQL 时区设置方法, MySQL 日期范围对比, 高性能 MySQL 日期存储, MySQL UNIX_TIMESTAMP 用法, 数值型时间戳优缺点, MySQL 时间存储性能优化, MySQL TIMESTAMP 时区转换, MySQL 时间格式转换, MySQL 时间存储空间对比, MySQL 时间类型选择建议, MySQL 日期类型性能分析, 数据库时间存储优化
6
10
---
7
11
8
- 我们平时开发中不可避免的就是要存储时间,比如我们要记录操作表中这条记录的时间、记录转账的交易时间、记录出发时间、用户下单时间等等。你会发现时间这个东西与我们开发的联系还是非常紧密的,用的好与不好会给我们的业务甚至功能带来很大的影响。所以,我们有必要重新出发,好好认识一下这个东西。
12
+ 在日常的软件开发工作中,存储时间是一项基础且常见的需求。无论是记录数据的操作时间、金融交易的发生时间,还是行程的出发时间、用户的下单时间等等,时间信息与我们的业务逻辑和系统功能紧密相关。因此,正确选择和使用 MySQL 的日期时间类型至关重要,其恰当与否甚至可能对业务的准确性和系统的稳定性产生显著影响。
13
+
14
+ 本文旨在帮助开发者重新审视并深入理解 MySQL 中不同的时间存储方式,以便做出更合适项目业务场景的选择。
9
15
10
16
## 不要用字符串存储日期
11
17
12
- 和绝大部分对数据库不太了解的新手一样,我在大学的时候就这样干过,甚至认为这样是一个不错的表示日期的方法。毕竟简单直白,容易上手 。
18
+ 和许多数据库初学者一样,笔者在早期学习阶段也曾尝试使用字符串(如 VARCHAR)类型来存储日期和时间,甚至一度认为这是一种简单直观的方法。毕竟,'YYYY-MM-DD HH:MM : SS ' 这样的格式看起来清晰易懂 。
13
19
14
20
但是,这是不正确的做法,主要会有下面两个问题:
15
21
16
- 1 . 字符串占用的空间更大!
17
- 2 . 字符串存储的日期效率比较低(逐个字符进行比对),无法用日期相关的 API 进行计算和比较。
22
+ 1 . ** 空间效率** :与 MySQL 内建的日期时间类型相比,字符串通常需要占用更多的存储空间来表示相同的时间信息。
23
+ 2 . ** 查询与计算效率低下** :
24
+ - ** 比较操作复杂且低效** :基于字符串的日期比较需要按照字典序逐字符进行,这不仅不直观(例如,'2024-05-01' 会小于 '2024-1-10'),而且效率远低于使用原生日期时间类型进行的数值或时间点比较。
25
+ - ** 计算功能受限** :无法直接利用数据库提供的丰富日期时间函数进行运算(例如,计算两个日期之间的间隔、对日期进行加减操作等),需要先转换格式,增加了复杂性。
26
+ - ** 索引性能不佳** :基于字符串的索引在处理范围查询(如查找特定时间段内的数据)时,其效率和灵活性通常不如原生日期时间类型的索引。
18
27
19
- ## Datetime 和 Timestamp 之间的抉择
28
+ ## DATETIME 和 TIMESTAMP 选择
20
29
21
- Datetime 和 Timestamp 是 MySQL 提供的两种比较相似的保存时间的数据类型,可以精确到秒。他们两者究竟该如何选择呢 ?
30
+ ` DATETIME ` 和 ` TIMESTAMP ` 是 MySQL 中两种非常常用的、用于存储包含日期和时间信息的数据类型。它们都可以存储精确到秒(MySQL 5.6.4+ 支持更高精度的小数秒)的时间值。那么,在实际应用中,我们应该如何在这两者之间做出选择呢 ?
22
31
23
- 下面我们来简单对比一下二者。
32
+ 下面我们从几个关键维度对它们进行对比:
24
33
25
34
### 时区信息
26
35
27
- ** DateTime 类型是没有时区信息的(时区无关)** ,DateTime 类型保存的时间都是当前会话所设置的时区对应的时间。这样就会有什么问题呢?当你的时区更换之后,比如你的服务器更换地址或者更换客户端连接时区设置的话,就会导致你从数据库中读出的时间错误。
36
+ ` DATETIME ` 类型存储的是** 字面量的日期和时间值** ,它本身** 不包含任何时区信息** 。当你插入一个 ` DATETIME ` 值时,MySQL 存储的就是你提供的那个确切的时间,不会进行任何时区转换。
37
+
38
+ ** 这样就会有什么问题呢?** 如果你的应用需要支持多个时区,或者服务器、客户端的时区可能发生变化,那么使用 ` DATETIME ` 时,应用程序需要自行处理时区的转换和解释。如果处理不当(例如,假设所有存储的时间都属于同一个时区,但实际环境变化了),可能会导致时间显示或计算上的混乱。
28
39
29
- ** Timestamp 和时区有关** 。Timestamp 类型字段的值会随着服务器时区的变化而变化,自动换算成相应的时间,说简单点就是在不同时区,查询到同一个条记录此字段的值会不一样。
40
+ ** ` TIMESTAMP ` 和时区有关** 。存储时,MySQL 会将当前会话时区下的时间值转换成 UTC(协调世界时)进行内部存储。当查询 ` TIMESTAMP ` 字段时,MySQL 又会将存储的 UTC 时间转换回当前会话所设置的时区来显示。
41
+
42
+ 这意味着,对于同一条记录的 ` TIMESTAMP ` 字段,在不同的会话时区设置下查询,可能会看到不同的本地时间表示,但它们都对应着同一个绝对时间点(UTC 时间)。这对于需要全球化、多时区支持的应用来说非常有用。
30
43
31
44
下面实际演示一下!
32
45
@@ -41,16 +54,16 @@ CREATE TABLE `time_zone_test` (
41
54
) ENGINE= InnoDB DEFAULT CHARSET= utf8;
42
55
```
43
56
44
- 插入数据 :
57
+ 插入一条数据(假设当前会话时区为系统默认,例如 UTC+0): :
45
58
46
59
``` sql
47
60
INSERT INTO time_zone_test(date_time,time_stamp) VALUES (NOW(),NOW());
48
61
```
49
62
50
- 查看数据 :
63
+ 查询数据(在同一时区会话下) :
51
64
52
65
``` sql
53
- select date_time,time_stamp from time_zone_test;
66
+ SELECT date_time, time_stamp FROM time_zone_test;
54
67
```
55
68
56
69
结果:
@@ -63,25 +76,24 @@ select date_time,time_stamp from time_zone_test;
63
76
+---------------------+---------------------+
64
77
```
65
78
66
- 现在我们运行
67
-
68
- 修改当前会话的时区:
79
+ 现在,修改当前会话的时区为东八区 (UTC+8):
69
80
70
81
``` sql
71
- set time_zone= ' +8:00' ;
82
+ SET time_zone = ' +8:00' ;
72
83
```
73
84
74
- 再次查看数据 :
85
+ 再次查询数据 :
75
86
76
- ``` plain
87
+ ``` bash
88
+ # TIMESTAMP 的值自动转换为 UTC+8 时间
77
89
+---------------------+---------------------+
78
90
| date_time | time_stamp |
79
91
+---------------------+---------------------+
80
92
| 2020-01-11 09:53:32 | 2020-01-11 17:53:32 |
81
93
+---------------------+---------------------+
82
94
```
83
95
84
- ** 扩展:一些关于 MySQL 时区设置的一个常用 sql 命令**
96
+ ** 扩展:MySQL 时区设置常用 SQL 命令**
85
97
86
98
``` sql
87
99
# 查看当前会话时区
@@ -102,28 +114,26 @@ SET GLOBAL time_zone = 'Europe/Helsinki';
102
114
103
115
![ ] ( https://oss.javaguide.cn/github/javaguide/FhRGUVHFK0ujRPNA75f6CuOXQHTE.jpeg )
104
116
105
- 在 MySQL 5.6.4 之前,DateTime 和 Timestamp 的存储空间是固定的,分别为 8 字节和 4 字节。但是从 MySQL 5.6.4 开始,它们的存储空间会根据毫秒精度的不同而变化,DateTime 的范围是 5~ 8 字节,Timestamp 的范围是 4~ 7 字节。
117
+ 在 MySQL 5.6.4 之前,DateTime 和 TIMESTAMP 的存储空间是固定的,分别为 8 字节和 4 字节。但是从 MySQL 5.6.4 开始,它们的存储空间会根据毫秒精度的不同而变化,DateTime 的范围是 5~ 8 字节,TIMESTAMP 的范围是 4~ 7 字节。
106
118
107
119
### 表示范围
108
120
109
- Timestamp 表示的时间范围更小,只能到 2038 年:
121
+ ` TIMESTAMP ` 表示的时间范围更小,只能到 2038 年:
110
122
111
- - DateTime: 1000-01-01 00:00:00.000000 ~ 9999-12-31 23:59:59.499999
112
- - Timestamp: 1970-01-01 00:00:01.000000 ~ 2038-01-19 03:14:07.499999
123
+ - ` DATETIME ` :' 1000-01-01 00:00:00.000000' 到 ' 9999-12-31 23:59:59.999999'
124
+ - ` TIMESTAMP ` :' 1970-01-01 00:00:01.000000' UTC 到 ' 2038-01-19 03:14:07.999999' UTC
113
125
114
126
### 性能
115
127
116
- 由于 TIMESTAMP 需要根据时区进行转换,所以从毫秒数转换到 TIMESTAMP 时,不仅要调用一个简单的函数,还要调用操作系统底层的系统函数。这个系统函数为了保证操作系统时区的一致性,需要进行加锁操作,这就降低了效率。
117
-
118
- DATETIME 不涉及时区转换,所以不会有这个问题。
128
+ 由于 ` TIMESTAMP ` 在存储和检索时需要进行 UTC 与当前会话时区的转换,这个过程可能涉及到额外的计算开销,尤其是在需要调用操作系统底层接口获取或处理时区信息时。虽然现代数据库和操作系统对此进行了优化,但在某些极端高并发或对延迟极其敏感的场景下,` DATETIME ` 因其不涉及时区转换,处理逻辑相对更简单直接,可能会表现出微弱的性能优势。
119
129
120
- 为了避免 TIMESTAMP 的时区转换问题,建议使用指定的时区,而不是依赖于操作系统时区 。
130
+ 为了获得可预测的行为并可能减少 ` TIMESTAMP ` 的转换开销,推荐的做法是在应用程序层面统一管理时区,或者在数据库连接/会话级别显式设置 ` time_zone ` 参数,而不是依赖服务器的默认或操作系统时区 。
121
131
122
132
## 数值时间戳是更好的选择吗?
123
133
124
- 很多时候,我们也会使用 int 或者 bigint 类型的数值也就是数值时间戳来表示时间 。
134
+ 除了上述两种类型,实践中也常用整数类型( ` INT ` 或 ` BIGINT ` )来存储所谓的“Unix 时间戳”(即从 1970 年 1 月 1 日 00:00:00 UTC 起至目标时间的总秒数,或毫秒数) 。
125
135
126
- 这种存储方式的具有 Timestamp 类型的所具有一些优点,并且使用它的进行日期排序以及对比等操作的效率会更高,跨系统也很方便,毕竟只是存放的数值。缺点也很明显,就是数据的可读性太差了,你无法直观的看到具体时间。
136
+ 这种存储方式的具有 ` TIMESTAMP ` 类型的所具有一些优点,并且使用它的进行日期排序以及对比等操作的效率会更高,跨系统也很方便,毕竟只是存放的数值。缺点也很明显,就是数据的可读性太差了,你无法直观的看到具体时间。
127
137
128
138
时间戳的定义如下:
129
139
@@ -132,15 +142,17 @@ DATETIME 不涉及时区转换,所以不会有这个问题。
132
142
数据库中实际操作:
133
143
134
144
``` sql
135
- mysql> select UNIX_TIMESTAMP(' 2020-01-11 09:53:32' );
145
+ -- 将日期时间字符串转换为 Unix 时间戳 (秒)
146
+ mysql> SELECT UNIX_TIMESTAMP(' 2020-01-11 09:53:32' );
136
147
+ -- -------------------------------------+
137
148
| UNIX_TIMESTAMP(' 2020-01-11 09:53:32' ) |
138
149
+ -- -------------------------------------+
139
150
| 1578707612 |
140
151
+ -- -------------------------------------+
141
152
1 row in set (0 .00 sec)
142
153
143
- mysql> select FROM_UNIXTIME(1578707612 );
154
+ -- 将 Unix 时间戳 (秒) 转换为日期时间格式
155
+ mysql> SELECT FROM_UNIXTIME(1578707612 );
144
156
+ -- -------------------------+
145
157
| FROM_UNIXTIME(1578707612 ) |
146
158
+ -- -------------------------+
@@ -149,13 +161,26 @@ mysql> select FROM_UNIXTIME(1578707612);
149
161
1 row in set (0 .01 sec)
150
162
```
151
163
164
+ ## PostgreSQL 中没有 DATETIME
165
+
166
+ 由于有读者提到 PostgreSQL(PG) 的时间类型,因此这里拓展补充一下。PG 官方文档对时间类型的描述地址:< https://www.postgresql.org/docs/current/datatype-datetime.html > 。
167
+
168
+ ![ PostgreSQL 时间类型总结] ( https://oss.javaguide.cn/github/javaguide/mysql/pg-datetime-types.png )
169
+
170
+ 可以看到,PG 没有名为 ` DATETIME ` 的类型:
171
+
172
+ - PG 的 ` TIMESTAMP WITHOUT TIME ZONE ` 在功能上最接近 MySQL 的 ` DATETIME ` 。它存储日期和时间,但不包含任何时区信息,存储的是字面值。
173
+ - PG 的` TIMESTAMP WITH TIME ZONE ` (或 ` TIMESTAMPTZ ` ) 相当于 MySQL 的 ` TIMESTAMP ` 。它在存储时会将输入值转换为 UTC,并在检索时根据当前会话的时区进行转换显示。
174
+
175
+ 对于绝大多数需要记录精确发生时间点的应用场景,` TIMESTAMPTZ ` 是 PostgreSQL 中最推荐、最健壮的选择,因为它能最好地处理时区复杂性。
176
+
152
177
## 总结
153
178
154
- MySQL 中时间到底怎么存储才好?Datetime?Timestamp ?还是数值时间戳?
179
+ MySQL 中时间到底怎么存储才好?` DATETIME ` ? ` TIMESTAMP ` ?还是数值时间戳?
155
180
156
181
并没有一个银弹,很多程序员会觉得数值型时间戳是真的好,效率又高还各种兼容,但是很多人又觉得它表现的不够直观。
157
182
158
- 《高性能 MySQL 》这本神书的作者就是推荐 Timestamp ,原因是数值表示时间不够直观。下面是原文:
183
+ 《高性能 MySQL 》这本神书的作者就是推荐 TIMESTAMP ,原因是数值表示时间不够直观。下面是原文:
159
184
160
185
<img src =" https://oss.javaguide.cn/github/javaguide/%E9%AB%98%E6%80%A7%E8%83%BDmysql-%E4%B8%8D%E6%8E%A8%E8%8D%90%E7%94%A8%E6%95%B0%E5%80%BC%E6%97%B6%E9%97%B4%E6%88%B3.jpg " style =" zoom :50% ;" />
161
186
@@ -167,4 +192,10 @@ MySQL 中时间到底怎么存储才好?Datetime?Timestamp?还是数值时间
167
192
| TIMESTAMP | 4~ 7 字节 | YYYY-MM-DD hh:mm: ss [ .fraction] | 1970-01-01 00:00:01[ .000000] ~ 2038-01-19 03:14:07[ .999999] | 是 |
168
193
| 数值型时间戳 | 4 字节 | 全数字如 1578707612 | 1970-01-01 00:00:01 之后的时间 | 否 |
169
194
195
+ ** 选择建议小结:**
196
+
197
+ - ` TIMESTAMP ` 的核心优势在于其内建的时区处理能力。数据库负责 UTC 存储和基于会话时区的自动转换,简化了需要处理多时区应用的开发。如果应用需要处理多时区,或者希望数据库能自动管理时区转换,` TIMESTAMP ` 是自然的选择(注意其时间范围限制,也就是 2038 年问题)。
198
+ - 如果应用场景不涉及时区转换,或者希望应用程序完全控制时区逻辑,并且需要表示 2038 年之后的时间,` DATETIME ` 是更稳妥的选择。
199
+ - 如果极度关注比较性能,或者需要频繁跨系统传递时间数据,并且可以接受可读性的牺牲(或总是在应用层转换),数值时间戳是一个强大的选项。
200
+
170
201
<!-- @include: @article-footer.snippet.md -->
0 commit comments