该文档涉及的组件

    Cross候选特征筛选模型 (CrossCandidateSelector)

    Java 类名:com.alibaba.alink.pipeline.feature.CrossCandidateSelector

    Python 类名:CrossCandidateSelector

    功能介绍

    从交叉特征候选集中,根据评估指标进行选择。

    参数说明

    名称 中文名称 描述 类型 是否必须? 取值范围 默认值
    crossFeatureNumber 特征个数 特征个数 Integer
    featureCandidates 特征候选集 特征候选集 String[]
    labelCol 标签列名 输入表中的标签列名 String
    outputCol 输出结果列列名 输出结果列列名,必选 String
    selectedCols 选择的列名 计算列对应的列名列表 String[]
    appendOriginalData 是否输出原数据 是否输出原数据 Boolean true
    categoricalCols 离散特征列名 离散特征列名 String[]
    discreteThresholds 离散个数阈值 离散个数阈值,低于该阈值的离散样本将不会单独成一个组别。 Integer -2147483648
    discreteThresholdsArray 离散个数阈值数组 离散个数阈值,每一列对应数组中一个元素。 Integer[] null
    fixCoefs 固定的模型参数 固定的模型参数 Boolean false
    fraction 采样比例 采样比例 Double 0.0 <= x <= 1.0 0.8
    kCross k折 k折 Integer x >= 1 1
    maxSearchStep 特征组合搜索步数 特征组合搜索步数 Integer 2
    modelFilePath 模型的文件路径 模型的文件路径 String null
    outputFormat 输出格式 输出格式 String “Dense”, “Sparse”, “Word” “Sparse”
    overwriteSink 是否覆写已有数据 是否覆写已有数据 Boolean false
    reservedCols 算法保留列名 算法保留列 String[] null
    modelStreamFilePath 模型流的文件路径 模型流的文件路径 String null
    modelStreamScanInterval 扫描模型路径的时间间隔 描模型路径的时间间隔,单位秒 Integer 10
    modelStreamStartTime 模型流的起始时间 模型流的起始时间。默认从当前时刻开始读。使用yyyy-mm-dd hh:mm:ss.fffffffff格式,详见Timestamp.valueOf(String s) String null