第一种写法:
row_number() over(partition by 一个或多个分组列 order by 一个或多个排序列 asc/desc) as 别名
//如果不写asc/desc的话,默认为asc

第二种写法:
row_number() over(distribute by 一个或多个分组列 sort by 一个或多个排序列 asc/desc) as 别名

在使用 row_number() over()函数时候,
over()里头的分组以及排序的执行晚于 where 、group by、 order by 的执行。

rn:为别名,代表每个分组中每行数据的所在序号ID,可用于根据rn序号ID直接获取出每个分组中的第一条数据

例子:按name分组,按日期排序

select
    *,
    row_number() over(distribute by name sort by date desc) rn
from
    table_A
;

常使用该函数进行去重

SELECT
	*
FROM
	(
	SELECT
	    a.*,
	    row_number() over(partition by name order by create_time desc) as rn 
	FROM
	    table_A a 
	)
WHERE
	rn=1
;

解释:按name分组,然后按数据创建时间降序排序,最后去rn=1就是取最新的一条数据,这也是一种去重的办法。

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐