数据库调优整体步骤、优化MySQL服务器硬件和参数、数据库结构优化、大表优化、其它3个策略
# 第12章_数据库其它调优策略

#08-数据库的其他优化策略

# 1. 数据库调优的措施

# 1.1 调优的目标
# 尽可能 节省系统资源 ,以便系统可以提供更大负荷的服务。(吞吐量更大)
# 合理的结构设计和参数调整,以提高用户操作 响应的速度 。(响应速度更快)
# 减少系统的瓶颈,提高MySQL数据库整体的性能。

# 1.2 如何定位调优问题
# 如何确定呢?一般情况下,有如下几种方式:
# 用户的反馈(主要)
# 日志分析(主要)
# 服务器资源使用监控
# 数据库内部状况监控
# 其它

# 除了活动会话监控以外,我们也可以对 事务 、 锁等待 等进行监控,
# 这些都可以帮助我们对数据库的运行状态有更全面的认识。

# 1.4 调优的维度和步骤
# 我们需要调优的对象是整个数据库管理系统,它不仅包括 SQL 查询,还包括数据库的部署配置、架构等。
# 从这个角度来说,我们思考的维度就不仅仅局限在 SQL 优化上了。通过如下的步骤我们进行梳理:
# 第1步:选择适合的 DBMS
# 第2步:优化表设计
# 第3步:优化逻辑查询
# 第4步:优化物理查询
# 第5步:使用 Redis 或 Memcached 作为缓存
# 第6步:库级优化
# 1、读写分离
# 2、数据分片

# 2. 优化MySQL服务器

# 2.1 优化服务器硬件
# 服务器的硬件性能直接决定着MySQL数据库的性能。
# 硬件的性能瓶颈直接决定MySQL数据库的运行速度和效率。
# 针对性能瓶颈提高硬件配置,可以提高MySQL数据库查询、更新的速度。
# (1) 配置较大的内存
# (2) 配置高速磁盘系统
# (3) 合理分布磁盘I/O
# (4) 配置多处理器

# 2.2 优化MySQL的参数

# innodb_buffer_pool_size :这个参数是Mysql数据库最重要的参数之一,
# 表示InnoDB类型的 表和索引的最大缓存 。它不仅仅缓存 索引数据 ,还会缓存 表的数据 。
# 这个值越大,查询的速度就会越快。但是这个值太大会影响操作系统的性能。

# key_buffer_size :表示 索引缓冲区的大小 。索引缓冲区是所有的 线程共享 。
# 增加索引缓冲区可以得到更好处理的索引(对所有读和多重写)。当然,这个值不是越大越好,
# 它的大小取决于内存的大小。如果这个值太大,就会导致操作系统频繁换页,也会降低系统性能。
# 对于内存在 4GB 左右的服务器该参数可设置为 256M 或 384M 。

# table_cache :表示 同时打开的表的个数 。这个值越大,能够同时打开的表的个数越多。物理内存越大,
# 设置就越大。默认为2402,调到512-1024最佳。这个值不是越大越好,
# 因为同时打开的表太多会影响操作系统的性能。

# query_cache_size :表示 查询缓冲区的大小 。可以通过在MySQL控制台观察,
# 如果Qcache_lowmem_prunes的值非常大,则表明经常出现缓冲不够的情况,就要增加Query_cache_size的值;
# 如果Qcache_hits的值非常大,则表明查询缓冲使用非常频繁,如果该值较小反而会影响效率,
# 那么可以考虑不用查询缓存;Qcache_free_blocks,如果该值非常大,则表明缓冲区中碎片很多。
# MySQL8.0之后失效。该参数需要和query_cache_type配合使用。

# query_cache_type 的值是0时,所有的查询都不使用查询缓存区。
# 但是query_cache_type=0并不会导致MySQL释放query_cache_size所配置的缓存区内存。
#     当query_cache_type=1时,所有的查询都将使用查询缓存区,除非在查询语句中指定SQL_NO_CACHE ,
# 如SELECT SQL_NO_CACHE * FROM tbl_name。
#     当query_cache_type=2时,只有在查询语句中使用 SQL_CACHE 关键字,查询才会使用查询缓存区。
# 使用查询缓存区可以提高查询的速度,这种方式只适用于修改操作少且经常执行相同的查询操作的情况。

# sort_buffer_size :表示每个 需要进行排序的线程分配的缓冲区的大小 。
# 增加这个参数的值可以提高 ORDER BY 或 GROUP BY 操作的速度。默认数值是2 097 144字节(约2MB)。
# 对于内存在4GB左右的服务器推荐设置为6-8M,如果有100个连接,
# 那么实际分配的总共排序缓冲区大小为100 × 6= 600MB。

# join_buffer_size = 8M :表示 联合查询操作所能使用的缓冲区大小 ,和sort_buffer_size一样,
# 该参数对应的分配内存也是每个连接独享。

# read_buffer_size :表示 每个线程连续扫描时为扫描的每个表分配的缓冲区的大小(字节) 。
# 当线程从表中连续读取记录时需要用到这个缓冲区。SET SESSION read_buffer_size=n可以临时设置该参数的值。
# 默认为64K,可以设置为4M。

# innodb_flush_log_at_trx_commit :表示 何时将缓冲区的数据写入日志文件 ,并且将日志文件写入磁盘中。
# 该参数对于innoDB引擎非常重要。该参数有3个值,分别为0、1和2。该参数的默认值为1。

#     值为 0 时,表示 每秒1次 的频率将数据写入日志文件并将日志文件写入磁盘。
# 每个事务的commit并不会触发前面的任何操作。该模式速度最快,但不太安全,
# mysqld进程的崩溃会导致上一秒钟所有事务数据的丢失。

#     值为 1 时,表示 每次提交事务时 将数据写入日志文件并将日志文件写入磁盘进行同步。该模式是最安全的,
# 但也是最慢的一种方式。因为每次事务提交或事务外的指令都需要把日志写入(flush)硬盘。

#     值为 2 时,表示 每次提交事务时 将数据写入日志文件, 每隔1秒 将日志文件写入磁盘。该模式速度较快,
# 也比0安全,只有在操作系统崩溃或者系统断电的情况下,上一秒钟所有事务数据才可能丢失。

# innodb_log_buffer_size :这是 InnoDB 存储引擎的 事务日志所使用的缓冲区 。为了提高性能,
# 也是先将信息写入 Innodb Log Buffer 中,
# 当满足 innodb_flush_log_trx_commit 参数所设置的相应条件(或者日志缓冲区写满)之后,
# 才会将日志写到文件(或者同步到磁盘)中。

# max_connections :表示 允许连接到MySQL数据库的最大数量 ,默认值是 151 。
# 如果状态变量connection_errors_max_connections 不为零,并且一直增长,
# 则说明不断有连接请求因数据库连接数已达到允许最大值而失败,这是可以考虑增大max_connections 的值。
# 在Linux 平台下,性能好的服务器,支持 500-1000 个连接不是难事,
# 需要根据服务器性能进行评估设定。这个连接数 不是越大越好 ,因为这些连接会浪费内存的资源。
# 过多的连接可能会导致MySQL服务器僵死。

# back_log :用于 控制MySQL监听TCP端口时设置的积压请求栈大小 。如果MySql的连接数达到max_connections时,
# 新来的请求将会被存在堆栈中,以等待某一连接释放资源,该堆栈的数量即back_log,
# 如果等待连接的数量超过back_log,将不被授予连接资源,将会报错。5.6.6 版本之前默认值为 50 ,
# 之后的版本默认为 50 + (max_connections / 5), 对于Linux系统推荐设置为小于512的整数,
# 但最大不超过900。
# 如果需要数据库在较短的时间内处理大量连接请求, 可以考虑适当增大back_log 的值。

# thread_cache_size : 线程池缓存线程数量的大小 ,当客户端断开连接后将当前线程缓存起来,
# 当在接到新的连接请求时快速响应无需创建新的线程 。
# 这尤其对那些使用短连接的应用程序来说可以极大的提高创建连接的效率。那么为了提高性能可以增大该参数的值。
# 默认为60,可以设置为120。
# 可以通过如下几个MySQL状态值来适当调整线程池的大小:
show global status like 'Thread%';
# 当 Threads_cached 越来越少,但 Threads_connected 始终不降,且 Threads_created 持续升高,
# 可适当增加 thread_cache_size 的大小。

# wait_timeout :指定 一个请求的最大连接时间 ,对于4GB左右内存的服务器可以设置为5-10。

# interactive_timeout :表示服务器在关闭连接前等待行动的秒数。

# 这里给出一份my.cnf的参考配置:

# [mysqld]

# port = 3306
# serverid = 1
# socket = /tmp/mysql.sock
# skip-locking
# 避免MySQL的外部锁定,减少出错几率增强稳定性。
# skip-name-resolve
#禁止MySQL对外部连接进行DNS解析,使用这一选项可以消除MySQL进行DNS解析的时间。但需要注意,
# 如果开启该选项,则所有远程主机连接授权都要使用IP地址方式,否则MySQL将无法正常处理连接请求!
# back_log = 384
# key_buffer_size = 256M
# max_allowed_packet = 4M
# thread_stack = 256K
# table_cache = 128K
# sort_buffer_size = 6M
# read_buffer_size = 4M
# read_rnd_buffer_size=16M
# join_buffer_size = 8M
# myisam_sort_buffer_size =64M
# table_cache = 512
# thread_cache_size = 64
# query_cache_size = 64M
# tmp_table_size = 256M
# max_connections = 768
# max_connect_errors = 10000000
# wait_timeout = 10
# thread_concurrency = 8
# 该参数取值为服务器逻辑CPU数量*2,在本例中,服务器有2颗物理CPU,而每颗物理CPU又支持H.T超线程,
# 所以实际取值为4*2=8
# skip-networking
#开启该选项可以彻底关闭MySQL的TCP/IP连接方式,
# 如果WEB服务器是以远程连接的方式访问MySQL数据库服务器则不要开启该选项!否则将无法正常连接!
# table_cache=1024
# innodb_additional_mem_pool_size=4M
#默认为2M
# innodb_flush_log_at_trx_commit=1
# innodb_log_buffer_size=2M
# 默认为1M
# innodb_thread_concurrency=8
#你的服务器CPU有几个就设置为几。建议用默认一般为8
# tmp_table_size=64M
# 默认为16M,调到64-256最挂

# thread_cache_size=120
# query_cache_size=32M

# 很多情况还需要具体情况具体分析!

# 案例分析:
# 总结一下就是遇到CPU资源不足的问题,可以从下面2个思路去解决。
#     疏通拥堵路段,消除瓶颈,让等待的时间更短;
#     开拓新的通道,增加并行处理能力。

# 3. 优化数据库结构

# 3.1 拆分表:冷热数据分离

# 3.2 增加中间表

# 3.3 增加冗余字段
# 设计数据库表时应尽量遵循范式理论的规约,尽可能减少冗余字段,让数据库设计看起来精致、优雅。
# 但是,合理地加入冗余字段可以提高查询速度。

# 表的规范化程度越高,表与表之间的关系就越多,需要连接查询的情况也就越多。尤其在数据量大,
# 而且需要频繁进行连接的时候,为了提升效率,我们也可以考虑增加冗余字段来减少连接。

# 3.4 优化数据类型
# 情况1:对整数类型数据进行优化。
# 遇到整数类型的字段可以用 INT 型 。这样做的理由是,INT 型数据有足够大的取值范围,
# 不用担心数据超出取值范围的问题。刚开始做项目的时候,首先要保证系统的稳定性,这样设计字段类型是可以的。
# 但在数据量很大的时候,数据类型的定义,在很大程度上会影响到系统整体的执行效率。

# 对于 非负型 的数据(如自增ID、整型IP)来说,要优先使用无符号整型 UNSIGNED 来存储。
# 因为无符号相对于有符号,同样的字节数,存储的数值范围更大。如tinyint有符号为-128-127,无符号为0-255,
# 多出一倍的存储空间。

# 情况2:既可以使用文本类型也可以使用整数类型的字段,要选择使用整数类型。
# 跟文本类型数据相比,大整数往往占用 更少的存储空间 ,因此,在存取和比对的时候,可以占用更少的内存空间。
# 所以,在二者皆可用的情况下,尽量使用整数类型,这样可以提高查询的效率。如:将IP地址转换成整型数据。

# 情况3:避免使用TEXT、BLOB数据类型

# 情况4:避免使用ENUM类型

# 情况5:使用TIMESTAMP存储时间

# 情况6:用DECIMAL代替FLOAT和DOUBLE存储精确浮点数

# 总之,遇到数据量大的项目时,一定要在充分了解业务需求的前提下,合理优化数据类型,
# 这样才能充分发挥资源的效率,使系统达到最优。

# 3.5 优化插入记录的速度

# 1. MyISAM引擎的表:
# ① 禁用索引
# ② 禁用唯一性检查
# ③ 使用批量插入
# ④ 使用LOAD DATA INFILE 批量导入

# 2. InnoDB引擎的表:
# ① 禁用唯一性检查
# ② 禁用外键检查
# ③ 禁止自动提交

# 3.6 使用非空约束

# 在设计字段的时候,如果业务允许,建议尽量使用非空约束

# 3.7 分析表、检查表与优化表

#举例
CREATE TABLE `user1` (
  `id` INT NOT NULL AUTO_INCREMENT,
  `name` VARCHAR(255) DEFAULT NULL,
  `age` INT DEFAULT NULL,
  `sex` VARCHAR(255) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `idx_name` (`name`) USING BTREE
) ENGINE=INNODB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8mb3;

#
SET GLOBAL log_bin_trust_function_creators = 1;

DELIMITER //
CREATE FUNCTION  rand_num (from_num INT ,to_num INT) RETURNS INT(11)
BEGIN
DECLARE i INT DEFAULT 0;
SET i = FLOOR(from_num +RAND()*(to_num - from_num+1))   ;
RETURN i;
END //
DELIMITER ;

#
DELIMITER //
CREATE PROCEDURE  insert_user( max_num INT )
BEGIN
DECLARE i INT DEFAULT 0;
 SET autocommit = 0;
 REPEAT
 SET i = i + 1;
 INSERT INTO `user1` ( NAME,age,sex )
 VALUES ("atguigu",rand_num(1,20),"male");
 UNTIL i = max_num
 END REPEAT;
 COMMIT;
END //
DELIMITER ;

#
CALL insert_user(1000);

SHOW INDEX FROM user1;

SELECT * FROM user1;

UPDATE user1 SET NAME = 'atguigu03' WHERE id = 3;

# 1. 分析表
ANALYZE TABLE user1;

# 2. 检查表
CHECK TABLE user1;

# 3. 优化表

# 方式1:OPTIMIZE TABLE
CREATE TABLE t1(id INT,NAME VARCHAR(15)) ENGINE = MYISAM;

OPTIMIZE TABLE t1;

CREATE TABLE t2(id INT,NAME VARCHAR(15)) ENGINE = INNODB;

OPTIMIZE TABLE t2;

# 在MyISAM中,是先分析这张表,然后会整理相关的MySQL datafile,之后回收未使用的空间;在InnoDB中,
# 回收空间是简单通过Alter table进行整理空间。在优化期间,MySQL会创建一个临时表,
# 优化完成之后会删除原始表,然后会将临时表rename成为原始表。

# 说明: 在多数的设置中,根本不需要运行OPTIMIZE TABLE。即使对可变长度的行进行了大量的更新,
# 也不需要经常运行, 每周一次 或 每月一次 即可,并且只需要对 特定的表 运行。

# 方式2:使用mysqlcheck命令
# Linux下执行
# mysqlcheck -o atguigudb3 user1 -uroot -p

# 3.8 小结
# 上述这些方法都是有利有弊的。比如:
#     修改数据类型,节省存储空间的同时,你要考虑到数据不能超过取值范围;
#     增加冗余字段的时候,不要忘了确保数据一致性;
#     把大表拆分,也意味着你的查询会增加新的连接,从而增加额外的开销和运维的成本。因此,
# 你一定要结合实际的业务需求进行权衡。

# 4. 大表优化

# 4.1 限定查询的范围
# 禁止不带任何限制数据范围条件的查询语句。比如:我们当用户在查询订单历史的时候,
# 我们可以控制在一个月的范围内;

# 4.2 读/写分离
# 经典的数据库拆分方案,主库负责写,从库负责读。

# 4.3 垂直拆分
# 当数据量级达到 千万级 以上时,有时候我们需要把一个数据库切成多份,放到不同的数据库服务器上,
# 减少对单一数据库服务器的访问压力。

# 垂直拆分的优点: 可以使得列数据变小,在查询时减少读取的Block数,减少I/O次数。此外,
# 垂直分区可以简化表的结构,易于维护。

# 垂直拆分的缺点: 主键会出现冗余,需要管理冗余列,并会引起 JOIN 操作。此外,
# 垂直拆分会让事务变得更加复杂。

# 4.4 水平拆分

# 5. 其它调优策略

# 5.1 服务器语句超时处理
# 在MySQL 8.0中可以设置 服务器语句超时的限制 ,单位可以达到 毫秒级别 。
# 当中断的执行语句超过设置的毫秒数后,服务器将终止查询影响不大的事务或连接,然后将错误报给客户端。

# 5.2 创建全局通用表空间
CREATE TABLESPACE atguigu1 ADD DATAFILE 'atguigu1.ibd' file_block_size=16k;

CREATE TABLE test(id INT,NAME VARCHAR(10)) ENGINE=INNODB DEFAULT CHARSET utf8mb4 TABLESPACE atguigu1;

ALTER TABLE test TABLESPACE atguigu1;

DROP TABLESPACE atguigu1;

DROP TABLE test;

# 5.3 MySQL 8.0新特性:隐藏索引对调优的帮助
暂无评论

发送评论 编辑评论


				
|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
(╯‵□′)╯︵┴─┴
 ̄﹃ ̄
(/ω\)
∠( ᐛ 」∠)_
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ`)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯︵○○○
φ( ̄∇ ̄o)
ヾ(´・ ・`。)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò。)
Σ(っ °Д °;)っ
( ,,´・ω・)ノ"(´っω・`。)
╮(╯▽╰)╭
o(*////▽////*)q
>﹏<
( ๑´•ω•) "(ㆆᴗㆆ)
😂
😀
😅
😊
🙂
🙃
😌
😍
😘
😜
😝
😏
😒
🙄
😳
😡
😔
😫
😱
😭
💩
👻
🙌
🖕
👍
👫
👬
👭
🌚
🌝
🙈
💊
😶
🙏
🍦
🍉
😣
Source: github.com/k4yt3x/flowerhd
颜文字
Emoji
小恐龙
花!
上一篇
下一篇