该文档涉及的组件

    文档搜索模型(FullTextSearchModel)

    Java 类名:org.alinklab.pipeline.nlp.FullTextSearchModel

    Python 类名:FullTextSearchModel

    功能介绍

    文档搜索模型

    参数说明

    名称 中文名称 描述 类型 是否必须? 取值范围 默认值
    selectedCol 选中的列名 计算列对应的列名 String
    dateFormat 时间类型转换格式 时间类型转换格式 String YYYY-MM-DD hh:mm:ss
    modelFilePath 模型的文件路径 模型的文件路径 String null
    notStoredCols 不保存的检索列 不保存的检索列, 需要分词的文本检索列可以下选择不保存 String数组 null
    originSearchCols 原始检索列 原始检索列,包括文本列(不分词,直接原值匹配),数字类型列等 String数组 null
    outputCol 输出结果列 输出结果列列名,可选,默认null String null
    outputOriginText 是否输出原文 是否输出原文,是输出高亮结果和原文,不是只输出高亮 Boolean false
    overwriteSink 是否覆写已有数据 是否覆写已有数据 Boolean false
    reservedCols 算法保留列名 算法保留列 String数组 null
    textSearchColBoosts 文本检索列权重 文本检索列权重, 格式是col1:5;col2:1 String null
    textSearchCols 文本检索列 文本检索列(分词匹配) String数组 null
    tokenizerType 分词方法 分词方法 TokenizerType IKAnalyzer, JieBaAnalyzer, StandardAnalyzer, WhitespaceAnalyzer, SimpleAnalyzer, StopAnalyzer IKAnalyzer
    topN 前N的数据 挑选最近的N个数据 Integer x >= 1 10
    numThreads 组件多线程线程个数 组件多线程线程个数 Integer 1
    modelStreamFilePath 模型流的文件路径 模型流的文件路径 String null
    modelStreamScanInterval 扫描模型路径的时间间隔 描模型路径的时间间隔,单位秒 Integer 10
    modelStreamStartTime 模型流的起始时间 模型流的起始时间。默认从当前时刻开始读。使用yyyy-mm-dd hh:mm:ss.fffffffff格式,详见Timestamp.valueOf(String s) String null

    代码示例

    Java 代码