1、ROLLUP和CUBE函数,自动汇总数据
rollup就简单多了: select nvl(col_a,’合计’) col_a,nvl(col_b,decode(col_a,null,”,’小计’||col_a))
col_b,sum(col_c) from test_tbl group by rollup(col_a,col_b),结果如下 col_a col_b sum(col_c) —- —– ——– 1 b1 14 1 b2 31 1 小计1 45 2 b2 7 2 b3 46 2 小计2 53 合计 98 结果集刚好是先按A和B汇总,然后是按A汇总,最后是全部汇总这时候如果再要按B列汇总,怎么办
呢?又要用SQL嵌套吗?不是的,如果有这要求的话,改用cube函数就OK啦
(col_a,null,”,’小计’||col_a)) col_b,sum(col_c) from test_tbl group by cube(col_a,col_b) 结果如下 col_a col_b sum(col_c) —- —– ——– 1 b1 14 1 b2 31 1 小计1 45 2 b2 7 2 b3 46 2 小计2 53 小计b1 b1 14 小计b2 b2 38 小计b3 b3 46 合计 98 跟刚才rollup函数得到的结果集有点不一样,那就是多了些按B列的汇总行。
前一个和后一个数?如这个例里从1到13当中有目字3、6、7、10没被插入表中,这些数的前一个和后一
个分别是2和4、5和8、9和11,即 PREV_VAL NEXT_VAL ———- ———- 2 4 5 8 9 11 如果不用分析函数要得到这后结果集那真不敢想象是怎么样的一段SQL,但用LAG分析函数那就简单
了,这样写就OK select prev_val,next_val from( select col_k next_val,lag(col_k,1,0) over (order by col_k) prev_val from test_tbl ) where next_val-prev_val>1 对于LEAD函数是一样的,只不过它是往后链接而已。
3、RANK和DENSE_RANK函数,对数据进行排名
col_a order by 2 desc 结果是这样 COL_A SUM(COL_B) ———- ———- A 475 C 363 G 255 B 154 F 154 E 154 D 66 从这个数据集可以看出A是最大的,C是第二大的,当数据多时就不知道谁是排第几了,这时用
DENSE_RANK可以达到这目的 select col_a,sum(col_b),dense_rank() over (order by sum(col_b) desc) ranks from
test_tbl group by col_a 结果如下 COL_A SUM(COL_B) RANKS ———- ———- ———- A 475 1 C 363 2 G 255 3 B 154 4 F 154 4 E 154 4 D 66 5 这个数据集把每个值都排了名次,可以直接看得出,相同值的名次是相同的。 用RANK跟DENSE_RANK差不多,不过就是当出现在名次相同时,下一个名次会跳跃 select col_a,sum(col_b),rank() over (order by sum(col_b) desc ) ranks from test_tbl
group by col_a 结果如下 COL_A SUM(COL_B) RANKS ———- ———- ———- A 475 1 C 363 2 G 255 3 B 154 4 F 154 4 E 154 4 D 66 7 可以看到名次从4跳跃到7,就是因为名次4重复出现了两次
排名 select col_g,col_a,sum(col_b),dense_rank() over (partition by col_g order by sum
(col_b) desc ) ranks from test_tbl group by col_g,col_a这个SQL加了partition by先按G列分组,结果如下 COL_G COL_A SUM(COL_B) RANKS ———- ———- ———- ———- G1 A 475 1 G2 C 363 1 G2 B 154 2 G2 E 154 2 G2 D 66 3 G3 G 255 1 G3 F 154 2 可以看到名次都是在G列的组别发生变化时,就会重新开始新排列