详解用TSQL在SQL Server实现物理查询数据流
创始人
2024-03-25 12:51:46
0

当一个查询到达数据库引擎时,SQL Server执行两个主要的步骤来产生结果。***步是查询编译,他生成查询计划;第二部执行这个查询计划。

查询编译由三个步骤组成:分析、代数化及查询优化。然后编译器把经过优化的查询计划保存到过程缓存中。然后执行引擎把该计划转换为可执行的形式,然后执行其中的步骤以生成查询结果。如果今后再执行相同的查询或存储过程时,过程缓存已经包含了该计划,则跳过编译步骤,直接重用缓存的计划来执行该查询或存储过程。

安装Northwind数据库,点选“包括实际的执行计划”并执行以下查询:

USE Northwind;

GO

SELECT C.CustomerID, COUNT(O.OrderID) AS NumOrders

FROM dbo.Customers AS C

LEFT OUTER JOIN dbo.Orders AS O

ON C.CustomerID = O.CustomerID

WHERE C.City = 'London'

GROUP BY C.CustomerID

HAVING COUNT(O.OrderID) > 5

ORDER BY NumOrders;

生成结果:

执行计划流程图:

未标题-1副本.png

文本形式的执行计划输出:

|--Sort(ORDER BY:([Expr1004] ASC))

|--Filter(WHERE:([Expr1004]>(5)))

|--Compute Scalar(DEFINE:([Expr1004]=CASE WHEN [Expr1004] IS NULL THEN (0) ELSE [Expr1004] END))

|--Nested Loops(Left Outer Join, OUTER REFERENCES:([C].[CustomerID]))

|--Index Seek(OBJECT:([Northwind].[dbo].[Customers].[City] AS [C]),

SEEK:([C].[City]=N'London') ORDERED FORWARD)

|--Compute Scalar(DEFINE:([Expr1004]=CONVERT_IMPLICIT(int,[Expr1009],0)))

|--Stream Aggregate(DEFINE:([Expr1009]=Count(*)))

|--Index Seek(OBJECT:([Northwind].[dbo].[Orders].[CustomersOrders] AS [O]), SEEK:([O].

[CustomerID]=[Northwind].[dbo].[Customers].[CustomerID] as [C].[CustomerID]) ORDERED FORWARD)

计划中的分支是交叉执行的。该示例中SQL Server交替执行嵌套循环的两个分支。

灰色箭头表示数据流,箭头的粗细表示查询优化器估计通过该连接传递的行数。

引擎先对Customers表执行索引查找,他将选择来自London的***个消费者。可以查看此部操作的详细信息,如下图。

未标题-2.png

可以看到此步的查找谓词的前缀为:

[Northwind].[dbo].[Customers].[City] = N'London

被选择的行被传递到嵌套循环运算符,嵌套循环则会开始进行内层循环的运算。内层循环由计算标量、流聚合、索引查找组成。

查看一下内层循环的***步,索引查找的详细信息,如下图:

未标题-2.png

查找谓词的前缀为:

[Northwind].[dbo].[Orders].CustomerId =

([Northwind].[dbo].[Customers].CustomerID as [C].CustomerID)

我们看到C.CustomerID的值被用于查找Orders表以获得该CustomerID的所有订单。也就是说嵌套循环的内侧引用了从外侧得到的值。

紧接着,查询会在找到来自London的***个消费者的所有订单之后,将这些订单传递给流聚合运算符进行统计。从文本形式的执行计划输出上可以很好的理解流聚合在这里做了什么。

|--Stream Aggregate(DEFINE:([Expr1009]=Count(*)))

其实他就是数了一下,有多少个订单。

然后是计算标量的操作:

|--Compute Scalar(DEFINE:([Expr1004]=CONVERT_IMPLICIT(int,[Expr1009],0)))

其实就是做了一下类型转换。

然后,内侧操作的结果会保存到外侧的那行中,说白了就是把London的***个消费者的订单数量存在这个消费者对象之中。

那么是不是当所有的嵌套循环执行完成后,形成了一个由(消费者,该消费者的订单个数)这样的结构所组成的数组呢?答案是否定的,因为计划中的分支是交叉执行的。当一个消费者完成了数数的工作,也完成他自己在前4步的操作,进入左上角的计算标量运算符中。

那么然后,由左上角的计算标量来处理这个数据,这个步骤就是做了一下值的检查:

|--Compute Scalar(DEFINE:([Expr1004]=CASE WHEN [Expr1004] IS NULL THEN (0) ELSE [Expr1004] END))

这里的[Expr1004]在之前已经定义过,还记得吧,首先是求某一个消费者的所有订单数,然后把值做了类型转换。这里又增加了一些判断:如果[Expr1004]是NULL则返回0,否则则执行之前的[Expr1004]。

接着,将结果传递给筛选器运算符

未标题-2.png

文本形式的执行计划输出

|--Filter(WHERE:([Expr1004]>(5)))

这里很好理解,就是对这条数据进行谓词操作,如果值不为真,则移除掉该数据。

终于,数据到达了排序运算符。大家应该可以想到,在所有要被排序的行全部就绪之前进行排序是没有意义的,因此这些行会在排序这一步进行等待,也就是说如果对Customers表的索引查找操作又找到一个来自London的消费者,将重复执行上述过程,直到所有要返回的行到达了排序运算符后,将按正确的顺序返回这些行。

未标题-2.png

文本形式的执行计划输出:

|--Sort(ORDER BY:([Expr1004] ASC))

【编辑推荐】

  1. 浅谈SQL Server数据库并发测试方法
  2. 浅谈SQL Server触发器的使用
  3. 详解SQL Server 2005四种排名函数

相关内容

热门资讯

PHP新手之PHP入门 PHP是一种易于学习和使用的服务器端脚本语言。只需要很少的编程知识你就能使用PHP建立一个真正交互的...
网络中立的未来 网络中立性是什... 《牛津词典》中对“网络中立”的解释是“电信运营商应秉持的一种原则,即不考虑来源地提供所有内容和应用的...
各种千兆交换机的数据接口类型详... 千兆交换机有很多值得学习的地方,这里我们主要介绍各种千兆交换机的数据接口类型,作为局域网的主要连接设...
全面诠释网络负载均衡 负载均衡的出现大大缓解了服务器的压力,更是有效的利用了资源,提高了效率。那么我们现在来说一下网络负载...
什么是大数据安全 什么是大数据... 在《为什么需要大数据安全分析》一文中,我们已经阐述了一个重要观点,即:安全要素信息呈现出大数据的特征...
如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
P2P的自白|我不生产内容,我... 现在一提起P2P,人们就会联想到正在被有关部门“围剿”的互联网理财服务。×租宝事件使得劳...
Intel将Moblin社区控... 本周二,非营利机构Linux基金会宣布,他们将担负起Moblin社区的管理工作,而这之前,Mobli...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...