
回复
作者 | antigeneral了呀
来源 | 大数据羊说(ID:young_say)
转载请联系授权(微信ID:___antigeneral)
大家好,我是老羊,今天我们来学习 Flink SQL 中的 Window TopN 操作。
输入表字段:
输出结果:
可以看到结果是符合预期的,其中没有回撤数据。
数据源
:数据源即最新的词条下面的搜索词的搜索热度数据,消费到 Kafka 中数据后,将数据按照窗口聚合的 key 通过 hash 分发策略发送到下游窗口聚合算子窗口聚合算子
:进行窗口聚合计算,随着时间的推进,将窗口聚合结果计算完成发往下游窗口排序算子窗口排序算子
:这个算子其实也是一个窗口算子,只不过这个窗口算子为每个 Key 维护了一个 TopN 的榜单数据,接受到上游发送的窗口结果数据进行排序,随着时间的推进,窗口的结束,将排序的结果输出到下游数据汇算子。数据汇
:接收到上游的数据之后,然后输出到外部存储引擎中