该文档涉及的组件

    稀疏特征编码训练 (SparseFeatureIndexerTrainBatchOp)

    Java 类名:com.alibaba.alink.operator.batch.dataproc.SparseFeatureIndexerTrainBatchOp

    Python 类名:SparseFeatureIndexerTrainBatchOp

    功能介绍

    稀疏特征编码训练

    参数说明

    名称 中文名称 描述 类型 是否必须? 取值范围 默认值
    selectedCol 选中的列名 计算列对应的列名 String 所选列类型为 [STRING]
    candidateTags 候选特征标签 筛选包含指定标签的特征 String[] null
    hasValue 是否有权重值 是否有权重值 Boolean true
    kvValDelimiter key和value之间分隔符 当输入数据为稀疏格式时,key和value的分割符 String “:”
    minFrequency 最低频次 最低频次,过滤掉出现次数小于该频次的特征 Integer -1
    minPercent 最小百分比阈值 最小百分比阈值,当minFrequency取值小于0时起作用,默认值-1 Double -1.0
    spareFeatureDelimiter 稀疏特征分隔符 稀疏特征分隔符 String “,”
    topN 前N的数据 前N的数据 Integer -1