Java 类名:com.alibaba.alink.operator.batch.dataproc.SparseFeatureIndexerTrainBatchOp
Python 类名:SparseFeatureIndexerTrainBatchOp
稀疏特征编码训练
名称 | 中文名称 | 描述 | 类型 | 是否必须? | 取值范围 | 默认值 |
---|---|---|---|---|---|---|
selectedCol | 选中的列名 | 计算列对应的列名 | String | ✓ | 所选列类型为 [STRING] | |
candidateTags | 候选特征标签 | 筛选包含指定标签的特征 | String[] | null | ||
hasValue | 是否有权重值 | 是否有权重值 | Boolean | true | ||
kvValDelimiter | key和value之间分隔符 | 当输入数据为稀疏格式时,key和value的分割符 | String | “:” | ||
minFrequency | 最低频次 | 最低频次,过滤掉出现次数小于该频次的特征 | Integer | -1 | ||
minPercent | 最小百分比阈值 | 最小百分比阈值,当minFrequency取值小于0时起作用,默认值-1 | Double | -1.0 | ||
spareFeatureDelimiter | 稀疏特征分隔符 | 稀疏特征分隔符 | String | “,” | ||
topN | 前N的数据 | 前N的数据 | Integer | -1 |