Java 类名:org.alinklab.app.form.GeneralRecommendForm
通用推荐
分区名称 | 分区描述 | 子分区名称 | 子分区描述 | 参数名称 | 参数描述 | 类型 | 是否必须? | 取值范围 | 默认值 |
---|---|---|---|---|---|---|---|---|---|
数据表 | 数据表 | 用于召回的行为数据表 | 用于召回的行为数据表 | 数据源类型 | 数据源类型 | SourceType | CSV, TSV, AK | AK | |
文件路径 | 文件路径 | String | ✓ | ||||||
列名和类型 | 数据的列名和类型。格式为"colname coltype[, colname2, coltype2[, ...]]",例如"f0 string, f1 bigint, f2 double" | String | |||||||
字段分隔符 | 字段分隔符 | String | It can't be empty string. | , | |||||
行分隔符 | 行分隔符 | String | It can't be empty string. | \n | |||||
User列列名 | User列列名 | String | ✓ | ||||||
Item列列名 | Item列列名 | String | ✓ | ||||||
打分列列名 | 打分列列名 | String | ✓ | ||||||
用于精排的行为数据表 | 用于精排的行为数据表 | 数据源类型 | 数据源类型 | SourceType | CSV, TSV, AK | AK | |||
文件路径 | 文件路径 | String | ✓ | ||||||
列名和类型 | 数据的列名和类型。格式为"colname coltype[, colname2, coltype2[, ...]]",例如"f0 string, f1 bigint, f2 double" | String | |||||||
字段分隔符 | 字段分隔符 | String | It can't be empty string. | , | |||||
行分隔符 | 行分隔符 | String | It can't be empty string. | \n | |||||
User列列名 | User列列名 | String | ✓ | ||||||
Item列列名 | Item列列名 | String | ✓ | ||||||
用户侧原数值特征 | 用户侧原数值特征 | String数组 | ✓ | ||||||
用户侧数值特征 | 用户侧数值特征 | String数组 | ✓ | ||||||
用户侧类别特征 | 用户侧类别特征 | String数组 | |||||||
物品侧原数值特征 | 物品侧原数值特征 | String数组 | ✓ | ||||||
物品侧数值特征 | 物品侧数值特征 | String数组 | ✓ | ||||||
物品侧类别特征 | 物品侧类别特征 | String数组 | |||||||
Tag特征 | Tag特征 | String数组 | ✓ | ||||||
时间列 | 时间列 | String | ✓ | ||||||
时间格式 | 时间格式: unixtime, timestamp, yyyy-mm-dd; 如果时间列是long型,可选是unixtime和timestamp, 默认是unixtime; 列类型是String, 格式是时间格式, 默认值是yyyy-mm-dd; 列类型是timestamp, 不做处理 | String | unixtime | ||||||
截止日期,格式是yyyy-mm-dd | 截止日期,格式是yyyy-mm-dd | String | null | ||||||
用户特征表 | 用户特征表 | 数据源类型 | 数据源类型 | SourceType | CSV, TSV, AK | AK | |||
文件路径 | 文件路径 | String | ✓ | ||||||
列名和类型 | 数据的列名和类型。格式为"colname coltype[, colname2, coltype2[, ...]]",例如"f0 string, f1 bigint, f2 double" | String | |||||||
字段分隔符 | 字段分隔符 | String | It can't be empty string. | , | |||||
行分隔符 | 行分隔符 | String | It can't be empty string. | \n | |||||
User列列名 | User列列名 | String | ✓ | ||||||
原数值特征 | 原数值特征 | String数组 | ✓ | ||||||
数值特征 | 数值特征 | String数组 | ✓ | ||||||
类别特征 | 类别特征 | String数组 | |||||||
Tag特征 | Tag特征 | String数组 | ✓ | ||||||
时间列 | 时间列 | String | ✓ | ||||||
时间格式 | 时间格式: unixtime, timestamp, yyyy-mm-dd; 如果时间列是long型,可选是unixtime和timestamp, 默认是unixtime; 列类型是String, 格式是时间格式, 默认值是yyyy-mm-dd; 列类型是timestamp, 不做处理 | String | unixtime | ||||||
截止日期,格式是yyyy-mm-dd | 截止日期,格式是yyyy-mm-dd | String | null | ||||||
物品特征表 | 物品特征表 | 数据源类型 | 数据源类型 | SourceType | CSV, TSV, AK | AK | |||
文件路径 | 文件路径 | String | ✓ | ||||||
列名和类型 | 数据的列名和类型。格式为"colname coltype[, colname2, coltype2[, ...]]",例如"f0 string, f1 bigint, f2 double" | String | |||||||
字段分隔符 | 字段分隔符 | String | It can't be empty string. | , | |||||
行分隔符 | 行分隔符 | String | It can't be empty string. | \n | |||||
Item列列名 | Item列列名 | String | ✓ | ||||||
原数值特征 | 原数值特征 | String数组 | ✓ | ||||||
数值特征 | 数值特征 | String数组 | ✓ | ||||||
类别特征 | 类别特征 | String数组 | |||||||
Tag特征 | Tag特征 | String数组 | ✓ | ||||||
时间列 | 时间列 | String | ✓ | ||||||
时间格式 | 时间格式: unixtime, timestamp, yyyy-mm-dd; 如果时间列是long型,可选是unixtime和timestamp, 默认是unixtime; 列类型是String, 格式是时间格式, 默认值是yyyy-mm-dd; 列类型是timestamp, 不做处理 | String | unixtime | ||||||
截止日期,格式是yyyy-mm-dd | 截止日期,格式是yyyy-mm-dd | String | null | ||||||
召回参数设置 | 召回参数设置 | ALS(交替最小二乘法) | ALS(交替最小二乘法协同过滤)参数设置 | 是否选择此路推荐方法 | 是否选择此路推荐方法 | Boolean | false | ||
因子数 | 因子数 | Integer | 10 | ||||||
是否约束因子非负 | 是否约束因子非负 | Boolean | false | ||||||
迭代次数 | 迭代次数,默认为10 | Integer | 10 | ||||||
排除已知的关联 | 推荐结果中是否排除训练数据中已知的关联 | Boolean | false | ||||||
召回个数 | 召回个数 | Integer | 10 | ||||||
FM(因子分解机) | FM(因子分解机)的参数设置 | 是否选择此路推荐方法 | 是否选择此路推荐方法 | Boolean | false | ||||
因子数 | 因子数 | Integer | 10 | ||||||
是否有常数项 | 是否有常数项,默认true | Boolean | true | ||||||
是否含有线性项 | 是否含有线性项 | Boolean | true | ||||||
排除已知的关联 | 推荐结果中是否排除训练数据中已知的关联 | Boolean | false | ||||||
召回个数 | 召回个数 | Integer | 10 | ||||||
ItemCf(物品协同过滤) | 基于物品的协同过滤(ItemCf)的参数设置 | 是否选择此路推荐方法 | 是否选择此路推荐方法 | Boolean | false | ||||
保存相似item的数目 | 保存相似item的数目,该参数设置后将降低内存使用量,同时可能会降低训练速度 | Integer | 64 | ||||||
距离度量方式 | 聚类使用的距离类型 | SimilarityType | COSINE, JACCARD, PEARSON | COSINE | |||||
相似阈值 | 只有大于该阈值的Object才会被计算 | Double | 1.0E-4 | ||||||
排除已知的关联 | 推荐结果中是否排除训练数据中已知的关联 | Boolean | false | ||||||
召回个数 | 召回个数 | Integer | 10 | ||||||
UserCf(用户协同过滤) | 基于用户的协同过滤(UserCf)的参数设置 | 是否选择此路推荐方法 | 是否选择此路推荐方法 | Boolean | false | ||||
相似集合元素数目 | 相似集合元素数目 | Integer | 64 | ||||||
距离度量方式 | 聚类使用的距离类型 | SimilarityType | COSINE, JACCARD, PEARSON | COSINE | |||||
相似阈值 | 只有大于该阈值的Object才会被计算 | Double | 1.0E-4 | ||||||
排除已知的关联 | 推荐结果中是否排除训练数据中已知的关联 | Boolean | false | ||||||
召回个数 | 召回个数 | Integer | 10 | ||||||
热门物品召回 | 基于热门物品召回的参数设置 | 是否选择此路推荐方法 | 是否选择此路推荐方法 | Boolean | false | ||||
召回个数 | 召回个数 | Integer | 64 | ||||||
精排特征配置 | 精排特征配置参数 | GBDT编码参数 | GBDT编码参数 | 模型中树的棵数 | 模型中树的棵数 | Integer | 100 | ||
分箱参数 | 分箱参数 | quantile个数 | quantile个数,对所有列有效。 | Integer | 2 | ||||
是否删除最后一个元素 | 删除最后一个元素是为了保证线性无关性。默认true | Boolean | true | ||||||
离散个数阈值 | 离散个数阈值,低于该阈值的离散样本将不会单独成一个组别。 | Integer | -2147483648 | ||||||
多热编码参数 | 多热编码参数 | 分隔符 | 用来分割字符串 | String | It can't be empty string. | ||||
离散个数阈值 | 离散个数阈值,低于该阈值的离散样本将不会单独成一个组别。 | Integer | -2147483648 | ||||||
特征哈希参数 | 特征哈希参数 | 向量维度 | 生成向量长度 | Integer | 262144 | ||||
时间统计特征参数 | 时间统计特征参数 | 统计时间周期 | 统计时间周期 | String数组 | [Ljava.lang.String;@35c09b94 | ||||
序列特征参数 | 序列特征参数 | 最近行为的序列长度 | 最近行为的序列长度 | Integer | -1 | ||||
embedding的向量长度 | embedding的向量长度 | Integer | x >= 1 | 100 | |||||
无 | 无 | 特征生成方式 | 特征生成方式 | FeatureGenerateType | GBDT, NORMAL | NORMAL | |||
精排参数设置 | 精排参数设置 | 无 | 无 | 精排算法类型 | 精排算法类型 | FineSortType | LR, FM, FM_REGRESSION | LR | |
目标表达式 | 二分类目标例如: event='click', 回归目标: In(play_time+1) | String | ✓ | ||||||
前N的数据 | 挑选最近的N个数据 | Integer | x >= 1 | 10 | |||||
输出参数设置 | 输出参数设置 | 预测请求物品列表 | 预测请求物品列表 | 请求的物品列表列名 | 请求的物品列表列名 | String | ✓ | ||
输出格式 | 输出格式,Text是使用空格相连 | ItemListFormat | JSON, CSV | CSV | |||||
字段分隔符 | 字段分隔符 | String | It can't be empty string. | , | |||||
行分隔符 | 行分隔符 | String | It can't be empty string. | \n | |||||
无 | 无 | 推荐结果列名 | 推荐结果列名 | String | ✓ | ||||
分数列名称 | 分数列名称 | String | ✓ | ||||||
物品特征保留列 | 物品特征保留列 | String数组 | null | ||||||
推荐模型保存地址 | 推荐模型保存地址 | String | ✓ | ||||||
部署地址 | 部署地址 | String | ✓ |