博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
RDS SQL Server - 最佳实践 - 高CPU使用率系列之数据类型转换
阅读量:6292 次
发布时间:2019-06-22

本文共 2426 字,大约阅读时间需要 8 分钟。

摘要

前两篇文章讨论了导致CPU高使用率的两个重要原因是索引缺失和索引碎片,本系列文章之三讨论数据类型隐式转换话题。

场景分析

在SQL Server中,比较运算符(大于、小于、等于或者连接)两端的数据类型需要保持一直才能进行。否则,SQL Server会按照数据类型优先级由低到高进行隐式转化,然后再进行比较。这个行为可以通过执行计划中的CONVERT_IMPLICIT关键字看出来,后面的测试例子中,我们可以清楚的看到这一点。如果很不幸,导致SQL Server正式表字段数据类型隐式转换会带来几个方面的问题:

 数据经过了转换,所以执行计划无法走更优的Index Seek,进而选择Index Scan
 由于Index Scan,所以I/O消耗很高
 数据类型转换计算和I/O飙高,导致CPU使用率很高
SQL Server数据类型转化参照表如下图(图片来自微软官网):
01.png

解决问题

在这里,我们将这个例子详细分解为五个小步骤:

 测试环境:搭建简单的测试环境。
 执行查询:SQL Server会隐式转换正式表字段中的数据为INT类型
 数据类型隐式转换:数据类型隐式转换的表现形式
 解决问题:修改查询语句比较运算符右边的数据类型为字符串格式
 效率对比:查询修改前后的性能对比

测试环境

我们在本系列文章之一创建的测试表上稍作修改:删除索引 => 修改字段ItemID为VARCHAR数据类型 => 创建索引。代码如下:

USE TestDbGO--===Drop index includedDROP INDEX IX_UserID_OrderDate_@ItemID_@OrderQty_@PriceON dbo.SalesOrder;GO--===Change Data type for Testing Data convertionALTER TABLE dbo.SalesOrderALTER COLUMN ItemID VARCHAR(8) NOT NULLGO--=== Create IndexesCREATE INDEX IX_ItemID_UserID_OrderDate_@OrderQty_@PriceON dbo.SalesOrder([ItemID],[UserID],[OrderDate])INCLUDE ([OrderQty], [Price])WITH (FILLFACTOR = 85);GOEXEC sys.sp_help 'dbo.SalesOrder'GO

从结果展示来看,ItemID已经变成了VARCAHR数据类型,展示如下:

02.png

执行查询

现在我们执行下面的查询语句,打开实际执行计划,注意WHERE ItemID = 250子句,等号右边的数据类型为INT,相比左边的数据类型VARCHAR优先级要高。所以,SQL Server必须先隐式转换正式表中该字段存储的所有数据为INT以后,再与250比较。这个转换操作会导致I/O飙高,无法使用索引和CPU使用率走高。

USE TestDbGOSET STATISTICS TIME ONSET STATISTICS IO ONSELECT     ItemID, OrderQty, PriceFROM dbo.SalesOrderWHERE ItemID = 250    AND OrderDate >= DATEADD(MONTH, -1, GETDATE())    AND OrderDate <= GETDATE();SET STATISTICS TIME OFFSET STATISTICS IO OFF

从性能指标页面来看,I/O为14950,CPU消耗327毫秒,时间消耗362毫秒,截图如下:

03.png

数据类型隐式转化

我们可以从执行计划中的CONVERT_IMPLICIT关键字看出,SQL Server做了数据类型的隐式转换,并且转换的是正式表中的数据。执行计划截图如下:

04.png

解决问题

问题分析清楚了,解决问题的方便变得非常简单。我们只需要保证比较运算符两端的数据类型一致,不让SQL Server隐式转换正式表字段中的数据,这样就可以大大减少I/O和CPU开销了。所以,我们把WHERE ItemID = 250子句修改为WHERE ItemID = '250'即可,修改后的查询如下:

USE TestDbGOSET STATISTICS TIME ONSET STATISTICS IO ONSELECT     ItemID, OrderQty, PriceFROM dbo.SalesOrderWHERE ItemID = '250'        --correct here to ItemID = '250'    AND OrderDate >= DATEADD(MONTH, -1, GETDATE())    AND OrderDate <= GETDATE();SET STATISTICS TIME OFFSET STATISTICS IO OFF

性能指标页面显示I/O消耗为61,CPU消耗为16毫秒,执行时间消耗为190毫秒,截图如下所示:

05.png

修改查询后的执行计划,走到了Index Seek,没有了CONVERT_IMPLICIT关键字的存在。执行计划截图如下:

06.png

性能对比

我们将修改查询语句前后的性能指标数据对比一下,执行时间提高了47.51%,CPU消耗提高了95.1%,I/O消耗提高了99.6%,平均性能提高了80.74%。对比数据做图如下:

07.png

总结

SQL Server做正式表字段数据类型隐式转换是导致高CPU使用率的另一重大原因,这篇文章详细分析了导致的原因、表象和解决问题的办法,指导我们平时在写查询语句的时候,需要时刻牢记比较运算符两端的数据类型保持一致。

引用文章

转载地址:http://jxjta.baihongyu.com/

你可能感兴趣的文章
分布式锁的一点理解
查看>>
idea的maven项目,install下载重复下载本地库中已有的jar包,而且下载后jar包都是lastupdated问题...
查看>>
2019测试指南-web应用程序安全测试(二)指纹Web服务器
查看>>
树莓派3链接wifi
查看>>
js面向对象编程
查看>>
Ruby中类 模块 单例方法 总结
查看>>
jQuery的validate插件
查看>>
5-4 8 管道符 作业控制 shell变量 环境变量配置
查看>>
Enumberable
查看>>
开发者论坛一周精粹(第五十四期) 求购备案服务号1枚!
查看>>
validate表单验证及自定义方法
查看>>
javascript 中出现missing ) after argument list的错误
查看>>
使用Swagger2构建强大的RESTful API文档(2)(二十三)
查看>>
Docker容器启动报WARNING: IPv4 forwarding is disabled. Networking will not work
查看>>
(转)第三方支付参与者
查看>>
程序员修炼之道读后感2
查看>>
DWR实现服务器向客户端推送消息
查看>>
js中forEach的用法
查看>>
Docker之功能汇总
查看>>
!!a标签和button按钮只允许点击一次,防止重复提交
查看>>