社区编辑申请
注册/登录
不同的数据库平台,如何取前百分之N的记录?
数据库 其他数据库
SQL Server和Oracle上都很容易实现,甚至是在MySQL 8.0也很容易实现,只是恰好我们业务数据库是MySQL 5.7。

​最近帮业务部门梳理业务报表,其中有个需求是就算某指标等待时间最长的前百分之十,其实就是对等待时长进行倒序排序后,取结果集的前百分之十。

这个需求在SQL Server和Oracle上都很容易实现,甚至是在MySQL 8.0也很容易实现,只是恰好我们业务数据库是MySQL 5.7。

先给大家介绍下不同数据库平台的实现方法。

SQL Server实现方法

SQL Server上有个TOP Percent的方法可以直接取结果的前(或后)百分之N。

例如有如下一张City表:

我们取前10%的数据记录可以这样写:

SELECT 
TOP 10 PERCENT
*
FROM City
ORDER BY ID DESC

结果如下:

图片

Oracle实现方法

Oracle有个ROWNUM伪列可以用来帮助我们计算前百分之N。

ROWNUM伪列的特点:

  • ROWNUM是按照记录插入时的顺序排序的。
  • ROWNUM并不实际存在,是对筛选后的结果集的一个排序,如果不存在结果集就不会有ROWNUM。
  • ROWNUM不能用基表名作为前缀。
  • 在使用ROWNUM进行查询时,请注意:

1)若使用大于号(>),则只能使用(>0),其他均不可以   。

2)若使用小于号(<),同一般情况    。

3)若使用等于号(=),则只能使用等于1(=1)我们可以先计算出整个表的记录行数量。

SELECT COUNT(*) CNT FROM City

然后根据count聚合查询总条数乘以百分比,来确定要查询的条数。

SELECT 0.1*COUNT(*) CNT FROM City

最后取出伪列小于共有数据的百分比的数据。

SELECT * FROM CITY
WHERE ID IN
(
SELECT ID FROM
(
SELECT ID FROM CITY ORDER BY ID DESC
)
WHERE ROWNUM < (SELECT COUNT(*)*0.1 FROM CITY)
)

注意:Oracle不支持子查询内ORDER BY,需要在外面再嵌套一层。

MySQL 8.0的实现方法

MySQL 8.0的实现方法主要是借助窗口函数ROW_NUMBER() OVER()。其实就是给排好序的集合添加一个自增长列,与Oracle的ROWNUM有点类似。

SELECT * FROM
(
SELECT *,
ROW_NUMBER() OVER(ORDER BY ID DESC) rn
FROM City
ORDER BY ID DESC
) a
WHERE a.rn<=(SELECT 0.1*COUNT(*) FROM City)

MySQL 5.X的实现方法

我们知道MySQL 5.X是没有开窗函数ROW_NUMBER() OVER()的,那该如何实现呢?

这里我们需要借助变量来实现,其实思路还是创建一个自增长列,只是方法不同。

SELECT 
A.*,
@row_num:=@row_num+1 AS ROW_NUM
FROM
City A , (SELECT @row_num:=0) B
ORDER BY ID DESC

这样我们就可以得到一张有自增长列的结果集了,接下来还是按照上面类似的方法,取前10%即可。

SELECT * FROM
(
SELECT
A.*,
@row_num:=@row_num+1 AS ROW_NUM
FROM
City A , (SELECT @row_num:=0) B
ORDER BY ID DESC
) C
WHERE C.ROW_NUM<=(@row_num*0.1)

其实MySQL 5.X也挺简单的,只是当时不怎么想用变量,想看看有没有其他办法,最后发现还是得用变量。

以上就是不同平台的数据库求前百分之N的方法了,代码可以验证一下收藏起来留着下次直接套用。

总结

其中有涉及一些知识点,需要小伙伴们自己去进一步了解:

  • SQL Server的TOP PERCENT。
  • Oracle的ROWNUM,子查询排序。
  • ROW_NUMBER() OVER()。
  • MySQL的变量​。
责任编辑:武晓燕 来源: SQL数据库开发
相关推荐

2021-09-02 07:09:18

2021-03-24 15:06:55

2022-06-20 22:37:25

Linux操作系统命令

2022-06-30 10:56:18

字节云数据库存储

2022-05-11 09:02:27

Python数据库Excel

2022-06-15 08:21:49

Linux运维工程师

2022-06-10 17:37:37

数据库

2022-06-16 09:22:28

图数据库图数据数据库

2022-06-22 09:56:19

PythonMySQL数据库

2022-06-27 17:46:53

PythonFlask

2022-06-15 16:16:21

分布式数据库鸿蒙

2022-06-23 11:42:22

MySQL数据库

2022-06-14 15:28:37

数据库存储系统变革趋势

2022-05-17 11:06:44

数据库MySQL系统

2022-05-10 12:01:55

腾讯云数据库

2022-06-26 06:32:28

MySQL数据库维护

2022-06-29 09:43:14

SQL优化数据库

2022-05-24 14:26:11

云原生数据库云架构

2022-05-09 15:52:23

MySQL数据库数据库表

2022-06-10 07:45:09

CentOS国产操作系统

同话题下的热门内容

横空出世的 Data Fabric,是下一个风口吗?SQL中常用的四个排序函数,你知道几个?分库分表实战:一叶知秋—图览分库分表外卖订单项目谈谈你对NoSQL的理解分库分表实战:最初的我们—了解一下单库外卖订单系统Flink SQL 知其所以然:TopN、Order By、Limit 操作一个注解搞定分布式事务分库分表实战:幸福的烦恼—流量大爆发啦!

编辑推荐

几款开源的图形化Redis客户端管理软件推荐NoSQL数据库概览及其与SQL语法的比较为什么MongoDB敢说“做以前你从未能做的事”Python操作MongoDB看这一篇就够了一文看懂分布式数据库原理和 PostgreSQL 分布式架构
我收藏的内容
点赞
收藏

51CTO技术栈公众号