MySQL decode,mysql nest loop偽代碼_Nested Loop Join

 2023-11-11 阅读 28 评论 0

摘要:我們都知道SQL的join關聯表的使用方式,但是這次聊的是實現join的算法,join有三種算法,分別是Nested Loop Join,Hash join,Sort Merge Join。MySQL官方文檔中提到,MySQL只支持Nested Loop Join這一種join algorithmMySQL decode。My

我們都知道SQL的join關聯表的使用方式,但是這次聊的是實現join的算法,join有三種算法,分別是Nested Loop Join,Hash join,Sort Merge Join。

MySQL官方文檔中提到,MySQL只支持Nested Loop Join這一種join algorithm

MySQL decode。MySQL resolves all joins using a nested-loop join method. This means that MySQL reads a row from the first table, and then finds a matching row in the second table, the third table, and so on. explain-output

所以本篇只聊Nested Loop Join。

NLJ是通過兩層循環,用第一張表做Outter Loop,第二張表做Inner Loop,Outter Loop的每一條記錄跟Inner Loop的記錄作比較,符合條件的就輸出。而NLJ又有3種細分的算法:

nested loops、1、Simple Nested Loop Join(SNLJ)

// 偽代碼

for (r in R) {

MySQL decimal,for (s in S) {

if (r satisfy condition s) {

output ;

MySQL case when?}

}

}

59bbae9dd0866cf608fdca4d5d70eb5b.png SNLJ就是兩層循環全量掃描連接的兩張表,得到符合條件的兩條記錄則輸出,這也就是讓兩張表做笛卡爾積,比較次數是R * S,是比較暴力的算法,會比較耗時。

2、Index Nested Loop Join(INLJ)

// 偽代碼

for (r in R) {

for (si in SIndex) {

if (r satisfy condition si) {

output ;

}

}

}

a16c98625db82cfcfabd366c5c0310c8.png

INLJ是在SNLJ的基礎上做了優化,通過連接條件確定可用的索引,在Inner Loop中掃描索引而不去掃描數據本身,從而提高Inner Loop的效率。 而INLJ也有缺點,就是如果掃描的索引是非聚簇索引,并且需要訪問非索引的數據,會產生一個回表讀取數據的操作,這就多了一次隨機的I/O操作。

3、Block Nested Loop Join(BNLJ)

一般情況下,MySQL優化器在索引可用的情況下,會優先選擇使用INLJ算法,但是在無索引可用,或者判斷full scan可能比使用索引更快的情況下,還是不會選擇使用過于粗暴的SNLJ算法。 這里就出現了BNLJ算法了,BNLJ在SNLJ的基礎上使用了join buffer,會提前讀取Inner Loop所需要的記錄到buffer中,以提高Inner Loop的效率。

// 偽代碼

for (r in R) {

for (sbu in SBuffer) {

if (r satisfy condition sbu) {

output ;

}

}

}

12f041c2f180d9f4067a5d2a01450694.png

MySQL中控制join buffer大小的參數名是join_buffer_size。

We only store the used columns in the join buffer, not the whole rows.
join-buffer-size

根據MySQL手冊中的說法,join_buffer_size緩沖的是被使用到的列。

算法比較(外表大小R,內表大小S):

\algorithm

comparison\

Simple Nested Loop Join

Index Nested Loop Join

Block Nested Loop Join

外表掃描次數

1

1

1

內表掃描次數

R

0

3dc7268f6e1a4e37445ac2e088d983d6.png

讀取記錄次數

R + R * S

R + RS_Matches

a3781161ace3712a8cca85b9a9d232af.png

比較次數

R * S

R * IndexHeight

R * S

回表次數

0

RS_Matches

0

在MySQL5.6中,對INLJ的回表操作進行了優化,增加了Batched Key Access Join(批量索引訪問的表關聯方式,這樣翻譯可以不。。。)和Multi Range Read(mrr,多范圍讀取)特性,在join操作中緩存所需要的數據的rowid,再批量去獲取其數據,把I/O從多次零散的操作優化為更少次數批量的操作,提高效率。

版权声明:本站所有资料均为网友推荐收集整理而来,仅供学习和研究交流使用。

原文链接:https://hbdhgg.com/1/170796.html

发表评论:

本站为非赢利网站,部分文章来源或改编自互联网及其他公众平台,主要目的在于分享信息,版权归原作者所有,内容仅供读者参考,如有侵权请联系我们删除!

Copyright © 2022 匯編語言學習筆記 Inc. 保留所有权利。

底部版权信息