该文档涉及的组件

    通用推荐(GeneralRecommendForm)

    Java 类名:org.alinklab.app.form.GeneralRecommendForm

    功能介绍

    通用推荐

    参数说明

    分区名称 分区描述 子分区名称 子分区描述 参数名称 参数描述 类型 是否必须? 取值范围 默认值
    数据表 数据表 用于召回的行为数据表 用于召回的行为数据表 数据源类型 数据源类型 SourceType CSV, TSV, AK AK
    文件路径 文件路径 String
    列名和类型 数据的列名和类型。格式为"colname coltype[, colname2, coltype2[, ...]]",例如"f0 string, f1 bigint, f2 double" String
    字段分隔符 字段分隔符 String It can't be empty string. ,
    行分隔符 行分隔符 String It can't be empty string. \n
    User列列名 User列列名 String
    Item列列名 Item列列名 String
    打分列列名 打分列列名 String
    用于精排的行为数据表 用于精排的行为数据表 数据源类型 数据源类型 SourceType CSV, TSV, AK AK
    文件路径 文件路径 String
    列名和类型 数据的列名和类型。格式为"colname coltype[, colname2, coltype2[, ...]]",例如"f0 string, f1 bigint, f2 double" String
    字段分隔符 字段分隔符 String It can't be empty string. ,
    行分隔符 行分隔符 String It can't be empty string. \n
    User列列名 User列列名 String
    Item列列名 Item列列名 String
    用户侧原数值特征 用户侧原数值特征 String数组
    用户侧数值特征 用户侧数值特征 String数组
    用户侧类别特征 用户侧类别特征 String数组
    物品侧原数值特征 物品侧原数值特征 String数组
    物品侧数值特征 物品侧数值特征 String数组
    物品侧类别特征 物品侧类别特征 String数组
    Tag特征 Tag特征 String数组
    时间列 时间列 String
    时间格式 时间格式: unixtime, timestamp, yyyy-mm-dd; 如果时间列是long型,可选是unixtime和timestamp, 默认是unixtime; 列类型是String, 格式是时间格式, 默认值是yyyy-mm-dd; 列类型是timestamp, 不做处理 String unixtime
    截止日期,格式是yyyy-mm-dd 截止日期,格式是yyyy-mm-dd String null
    用户特征表 用户特征表 数据源类型 数据源类型 SourceType CSV, TSV, AK AK
    文件路径 文件路径 String
    列名和类型 数据的列名和类型。格式为"colname coltype[, colname2, coltype2[, ...]]",例如"f0 string, f1 bigint, f2 double" String
    字段分隔符 字段分隔符 String It can't be empty string. ,
    行分隔符 行分隔符 String It can't be empty string. \n
    User列列名 User列列名 String
    原数值特征 原数值特征 String数组
    数值特征 数值特征 String数组
    类别特征 类别特征 String数组
    Tag特征 Tag特征 String数组
    时间列 时间列 String
    时间格式 时间格式: unixtime, timestamp, yyyy-mm-dd; 如果时间列是long型,可选是unixtime和timestamp, 默认是unixtime; 列类型是String, 格式是时间格式, 默认值是yyyy-mm-dd; 列类型是timestamp, 不做处理 String unixtime
    截止日期,格式是yyyy-mm-dd 截止日期,格式是yyyy-mm-dd String null
    物品特征表 物品特征表 数据源类型 数据源类型 SourceType CSV, TSV, AK AK
    文件路径 文件路径 String
    列名和类型 数据的列名和类型。格式为"colname coltype[, colname2, coltype2[, ...]]",例如"f0 string, f1 bigint, f2 double" String
    字段分隔符 字段分隔符 String It can't be empty string. ,
    行分隔符 行分隔符 String It can't be empty string. \n
    Item列列名 Item列列名 String
    原数值特征 原数值特征 String数组
    数值特征 数值特征 String数组
    类别特征 类别特征 String数组
    Tag特征 Tag特征 String数组
    时间列 时间列 String
    时间格式 时间格式: unixtime, timestamp, yyyy-mm-dd; 如果时间列是long型,可选是unixtime和timestamp, 默认是unixtime; 列类型是String, 格式是时间格式, 默认值是yyyy-mm-dd; 列类型是timestamp, 不做处理 String unixtime
    截止日期,格式是yyyy-mm-dd 截止日期,格式是yyyy-mm-dd String null
    召回参数设置 召回参数设置 ALS(交替最小二乘法) ALS(交替最小二乘法协同过滤)参数设置 是否选择此路推荐方法 是否选择此路推荐方法 Boolean false
    因子数 因子数 Integer 10
    是否约束因子非负 是否约束因子非负 Boolean false
    迭代次数 迭代次数,默认为10 Integer 10
    排除已知的关联 推荐结果中是否排除训练数据中已知的关联 Boolean false
    召回个数 召回个数 Integer 10
    FM(因子分解机) FM(因子分解机)的参数设置 是否选择此路推荐方法 是否选择此路推荐方法 Boolean false
    因子数 因子数 Integer 10
    是否有常数项 是否有常数项,默认true Boolean true
    是否含有线性项 是否含有线性项 Boolean true
    排除已知的关联 推荐结果中是否排除训练数据中已知的关联 Boolean false
    召回个数 召回个数 Integer 10
    ItemCf(物品协同过滤) 基于物品的协同过滤(ItemCf)的参数设置 是否选择此路推荐方法 是否选择此路推荐方法 Boolean false
    保存相似item的数目 保存相似item的数目,该参数设置后将降低内存使用量,同时可能会降低训练速度 Integer 64
    距离度量方式 聚类使用的距离类型 SimilarityType COSINE, JACCARD, PEARSON COSINE
    相似阈值 只有大于该阈值的Object才会被计算 Double 1.0E-4
    排除已知的关联 推荐结果中是否排除训练数据中已知的关联 Boolean false
    召回个数 召回个数 Integer 10
    UserCf(用户协同过滤) 基于用户的协同过滤(UserCf)的参数设置 是否选择此路推荐方法 是否选择此路推荐方法 Boolean false
    相似集合元素数目 相似集合元素数目 Integer 64
    距离度量方式 聚类使用的距离类型 SimilarityType COSINE, JACCARD, PEARSON COSINE
    相似阈值 只有大于该阈值的Object才会被计算 Double 1.0E-4
    排除已知的关联 推荐结果中是否排除训练数据中已知的关联 Boolean false
    召回个数 召回个数 Integer 10
    热门物品召回 基于热门物品召回的参数设置 是否选择此路推荐方法 是否选择此路推荐方法 Boolean false
    召回个数 召回个数 Integer 64
    精排特征配置 精排特征配置参数 GBDT编码参数 GBDT编码参数 模型中树的棵数 模型中树的棵数 Integer 100
    分箱参数 分箱参数 quantile个数 quantile个数,对所有列有效。 Integer 2
    是否删除最后一个元素 删除最后一个元素是为了保证线性无关性。默认true Boolean true
    离散个数阈值 离散个数阈值,低于该阈值的离散样本将不会单独成一个组别。 Integer -2147483648
    多热编码参数 多热编码参数 分隔符 用来分割字符串 String It can't be empty string.
    离散个数阈值 离散个数阈值,低于该阈值的离散样本将不会单独成一个组别。 Integer -2147483648
    特征哈希参数 特征哈希参数 向量维度 生成向量长度 Integer 262144
    时间统计特征参数 时间统计特征参数 统计时间周期 统计时间周期 String数组 [Ljava.lang.String;@35c09b94
    序列特征参数 序列特征参数 最近行为的序列长度 最近行为的序列长度 Integer -1
    embedding的向量长度 embedding的向量长度 Integer x >= 1 100
    特征生成方式 特征生成方式 FeatureGenerateType GBDT, NORMAL NORMAL
    精排参数设置 精排参数设置 精排算法类型 精排算法类型 FineSortType LR, FM, FM_REGRESSION LR
    目标表达式 二分类目标例如: event='click', 回归目标: In(play_time+1) String
    前N的数据 挑选最近的N个数据 Integer x >= 1 10
    输出参数设置 输出参数设置 预测请求物品列表 预测请求物品列表 请求的物品列表列名 请求的物品列表列名 String
    输出格式 输出格式,Text是使用空格相连 ItemListFormat JSON, CSV CSV
    字段分隔符 字段分隔符 String It can't be empty string. ,
    行分隔符 行分隔符 String It can't be empty string. \n
    推荐结果列名 推荐结果列名 String
    分数列名称 分数列名称 String
    物品特征保留列 物品特征保留列 String数组 null
    推荐模型保存地址 推荐模型保存地址 String
    部署地址 部署地址 String