[TOC] # EXCEPT/MINUS EXCEPT 算子用于对左右孩子算子输出集合进行差集运算,并进行去重。 Oracle 模式下一般使用 MINUS 进行差集运算,MySQL 模式下一般使用 EXCEPT 进行差集运算。OceanBase 数据库的 MySQL 模式不区分 EXCEPT 和 MINUS,两者均可作为差集运算关键字使用。 OceanBase 数据库支持的 EXCEPT 算子包括 MERGE EXCEPT DISTINCT 和 HASH EXCEPT DISTINCT。 ## MERGE EXCEPT DISTINCT 如下示例中,Q1 对两个查询使用 MINUS 进行联接, c1 有可用排序,0 号算子生成了 MERGE EXCEPT DISTINCT 进行求取差集、去重,由于 c2 无可用排序,所以在 3 号算子上分配了 SORT 算子进行排序。算子执行时从左右孩子节点读取有序输入,利用有序输入进行 MERGE, 实现去重并得到差集结果。 ~~~ obclient>CREATE TABLE t1(c1 INT PRIMARY KEY, c2 INT); Query OK, 0 rows affected (0.12 sec) obclient>INSERT INTO t1 VALUES(1,1); Query OK, 1 rows affected (0.12 sec) obclient>INSERT INTO t1 VALUES(2,2); Query OK, 1 rows affected (0.12 sec) Q1: obclient>EXPLAIN SELECT c1 FROM t1 MINUS SELECT c2 FROM t1\G; *************************** 1. row *************************** Query Plan: ============================================== |ID|OPERATOR |NAME|EST. ROWS|COST| ---------------------------------------------- |0 |MERGE EXCEPT DISTINCT| |2 |77 | |1 | TABLE SCAN |T1 |2 |37 | |2 | SORT | |2 |39 | |3 | TABLE SCAN |T1 |2 |37 | ============================================== Outputs & filters: ------------------------------------- 0 - output([MINUS(T1.C1, T1.C2)]), filter(nil) 1 - output([T1.C1]), filter(nil), access([T1.C1]), partitions(p0) 2 - output([T1.C2]), filter(nil), sort_keys([T1.C2, ASC]) 3 - output([T1.C2]), filter(nil), access([T1.C2]), partitions(p0) ~~~ 上述示例中,执行计划展示中的 outputs & filters 详细列出了 EXCEPT 算子的输出信息如下: <table data-tag="table" id="table-cfp-kbm-n1l" class="table"><colgroup span="1" width="139" data-tag="col" id="col-69k-sv5-dng" colwidth="1*" colnum="1" colname="col1" style="width:50%" class="col"></colgroup><colgroup span="1" width="609" data-tag="col" id="col-ajj-b2n-flu" colwidth="1*" colnum="2" colname="col2" style="width:50%" class="col"></colgroup><thead id="thead-wxg-whu-txs" class="thead"><tr id="tr-5yx-fmp-uyh"><th id="td-dgm-li6-wxj"><p id="p-qc5-3jk-c0h"><b>信息名称</b></p></th><th id="td-9fp-vhz-8sd"><p id="p-rfh-efi-nwa"><b>含义</b></p></th></tr></thead><tbody data-tag="tbody" id="tbody-mq0-sle-s8w" class="tbody"><tr data-tag="tr" id="tr-hqh-q9f-2xr" class="tr"><td data-tag="td" id="td-76g-h52-dh3" class="td"><p id="p-9uu-mgi-ao8">output</p></td><td data-tag="td" id="td-v8a-nep-b7g" class="td"><p id="p-0a6-lhz-n0v">该算子的输出表达式。</p><p id="p-0oy-s5o-uf0">使用 EXCEPT/MINUS 联接的两孩子算子对应输出(Oracle 模式使用 MINUS,MySQL 模式使用 EXCEPT),表示差集运算输出结果中的一列,括号内部为左右孩子节点对应此列的输出列。</p></td></tr><tr data-tag="tr" id="tr-73u-5qx-wdb" class="tr"><td data-tag="td" id="td-2ka-rdp-3mh" class="td"><p id="p-8ko-9u3-eym">filter</p></td><td data-tag="td" id="td-v4q-2nf-axp" class="td"><p id="p-et8-gp9-vzg">该算子上的过滤条件。</p><p id="p-wo3-iti-xzb">由于示例中 EXCEPT 算子没有设置 filter,所以为 nil。</p></td></tr></tbody></table> ## HASH EXCEPT DISTINCT 如下示例中,Q2 对两个查询使用 MINUS 进行联接,不可利用排序,0 号算子使用 HASH EXCEPT DISTINCT 进行求取差集、去重。算子执行时先读取左侧孩子节点输出建立哈希表并去重,再读取右侧孩子节点输出利用哈希表求取差集并去重。 ~~~ Q2: obclient>EXPLAIN SELECT c2 FROM t1 MINUS SELECT c2 FROM t1\G; *************************** 1. row *************************** Query Plan: ============================================= |ID|OPERATOR |NAME|EST. ROWS|COST| --------------------------------------------- |0 |HASH EXCEPT DISTINCT| |2 |77 | |1 | TABLE SCAN |T1 |2 |37 | |2 | TABLE SCAN |T1 |2 |37 | ============================================= Outputs & filters: ------------------------------------- 0 - output([MINUS(T1.C2, T1.C2)]), filter(nil) 1 - output([T1.C2]), filter(nil), access([T1.C2]), partitions(p0) 2 - output([T1.C2]), filter(nil), access([T1.C2]), partitions(p0) ~~~ 上述示例的执行计划展示中的 outputs & filters 详细列出了 HASH EXCEPT DISTINCT 算子的输出信息,字段的含义与 MERGE EXCEPT DISTINCT 算子相同。