Alink流式特征生成主要用来生成特征,包含Group窗口和Over窗口, 其中Group窗口是输出窗口聚合统计量,OVER窗口是每1个元素都对应1个窗口,给定一行数据,将窗口特征追加到数据后面,输出带特征的一行数据。
OverCount窗口中每1个元素对应1个窗口,即当前数据向前n条数组组成一个窗口,PrecedingRows确定窗口的大小。另外,当当前数据到来,直接触发窗口计算。
Alink的使用示例, 详细参数请参考文档。
与Count窗口不同,具有相同时间的所有行都是同一个窗口,PrecedingTime确定窗口大小。另外,当下一个时间点数据到来之后,触发窗口计算。
Alink的使用示例, 详细参数请参考文档。
滚动窗口(TUMBLE)将每个元素分配到一个指定大小的窗口中,窗口不会出现重叠。例如,指定5分钟的滚动窗口,数据会根据时间划分为[2022-01-01 01:00:00, 2022-01-01 01:05:00)、[2022-01-01 01:05:00, 2022-01-01 01:10:00)、[2022-01-01 01:15:00, 2022-01-01 01:20:00)等窗口。
下图是一个30秒的滚动窗口。(图片引用于https://help.aliyun.com/document_detail/62511.html)
Alink的使用示例, 详细参数请参考文档。
滑动窗口也叫做HopWindow, SlidingWindow。 有两个时间参数:windowTime(窗口长度)和hopTime(滑动长度)。 例如,计算过去5分钟数据的平均值,每10秒钟更新一次,可以设置windowTime为5分钟, hopTime为10秒。数据会根据时间划分为[2022-01-01 01:00:00, 2022-01-01 01:05:00)、[2022-01-01 01:00:10, 2022-01-01 01:05:10)、[2022-01-01 01:00:20, 2022-01-01 01:05:20) 等窗口。
下图是间隔为30秒,窗口大小为1分钟的滑动窗口。(图片引用于https://help.aliyun.com/document_detail/62512.html)
Alink的使用示例, 详细参数请参考文档。
会话窗口又叫做SessionWindow,它没有固定窗口大小,当它在一个固定的时间周期内不再收到数据,会话断开,窗口就会关闭。
下图是会话窗口(图片引用于https://help.aliyun.com/document_detail/62513.html)
Alink的使用示例, 详细参数请参考文档。