Java 类名:com.alibaba.alink.operator.stream.dataproc.WebTrafficIndexStreamOp
Python 类名:WebTrafficIndexStreamOp
网页流量通常用来构造特征
目前支持uv,pv,uip的计算
名称 | 中文名称 | 描述 | 类型 | 是否必须? | 取值范围 | 默认值 |
---|---|---|---|---|---|---|
keyCol | 键值列 | 键值列 | String | ✓ | ||
selectedCol | 选中的列名 | 计算列对应的列名 | String | ✓ | ||
bit | 比特数 | 比特数 | Integer | 10 | ||
format | 计数方式 | 计数方式 | String | “SPARSE”, “NORMAL” | “NORMAL” | |
index | 指标 | 指标 | String | “PV”, “UV”, “UIP”, “CARDINALITY_ESTIMATE_STOCHASTIC”, “CARDINALITY_ESTIMATE_LINEAR”, “CARDINALITY_ESTIMATE_LOGLOG”, “CARDINALITY_ESTIMATE_ADAPTIVE”, “CARDINALITY_ESTIMATE_HYPERLOGLOG”, “CARDINALITY_ESTIMATE_HYPERLOGLOGPLUS” | “PV” | |
timeInterval | 时间间隔 | 流式数据统计的时间间隔 | Double | 3.0 |
from pyalink.alink import * import pandas as pd useLocalEnv(1) data = RandomTableSourceStreamOp()\ .setNumCols(2)\ .setMaxRows(50)\ .setIdCol("id")\ .setOutputCols(["f0", "f1"]) \ .setOutputColConfs("f0:uniform_open(1,2);f1:uniform(1,2)")\ .setTimePerSample(0.1) op = WebTrafficIndexStreamOp()\ .setTimeInterval(1)\ .setSelectedCol("f0")\ .linkFrom(data) op.print() StreamOperator.execute()
1 window 8
2 all 506
3 window 10
4 all 516
5 window 10