文档搜索模型(FullTextSearchModel)

Java 类名：org.alinklab.pipeline.nlp.FullTextSearchModel

Python 类名：FullTextSearchModel

功能介绍

文档搜索模型

参数说明

名称	中文名称	描述	类型	是否必须？	取值范围	默认值
selectedCol	选中的列名	计算列对应的列名	String	✓
dateFormat	时间类型转换格式	时间类型转换格式	String			YYYY-MM-DD hh:mm:ss
modelFilePath	模型的文件路径	模型的文件路径	String			null
notStoredCols	不保存的检索列	不保存的检索列, 需要分词的文本检索列可以下选择不保存	String数组			null
originSearchCols	原始检索列	原始检索列，包括文本列(不分词，直接原值匹配)，数字类型列等	String数组			null
outputCol	输出结果列	输出结果列列名，可选，默认null	String			null
outputOriginText	是否输出原文	是否输出原文，是输出高亮结果和原文，不是只输出高亮	Boolean			false
overwriteSink	是否覆写已有数据	是否覆写已有数据	Boolean			false
reservedCols	算法保留列名	算法保留列	String数组			null
textSearchColBoosts	文本检索列权重	文本检索列权重, 格式是col1:5;col2:1	String			null
textSearchCols	文本检索列	文本检索列(分词匹配)	String数组			null
tokenizerType	分词方法	分词方法	TokenizerType		IKAnalyzer, JieBaAnalyzer, StandardAnalyzer, WhitespaceAnalyzer, SimpleAnalyzer, StopAnalyzer	IKAnalyzer
topN	前N的数据	挑选最近的N个数据	Integer		x >= 1	10
numThreads	组件多线程线程个数	组件多线程线程个数	Integer			1
modelStreamFilePath	模型流的文件路径	模型流的文件路径	String			null
modelStreamScanInterval	扫描模型路径的时间间隔	描模型路径的时间间隔，单位秒	Integer			10
modelStreamStartTime	模型流的起始时间	模型流的起始时间。默认从当前时刻开始读。使用yyyy-mm-dd hh:mm:ss.fffffffff格式，详见Timestamp.valueOf(String s)	String			null

代码示例

Java 代码