Hive에서 row_number 사용
구문:
row_number() over (필드별 파티션 a 계산 항목별 순서 b 설명) 순위
상위 10개 브랜드를 선택하려면 상위 10개 각 브랜드의 채널, 각 브랜드의 상위 10개 채널의 상위 10개 일정
1. 상위 10개 브랜드 가져오기
2. 상위 10개 미만의 각 브랜드의 상위 10개 채널 가져오기 브랜드
3 , 상위 10개 브랜드 중 각 브랜드의 상위 10개 채널에서 각 채널의 상위 10개 일정을 가져옵니다
row_number 사용은 실시간으로 자주 사용됩니다. Hive와 Spark의 계산은 파티션의 정렬 문제를 계산하기 때문에 row_number를 잘 사용하는 것이 매우 중요합니다.