该文档涉及的组件

    读取URL网页(ReadUrlPageStreamOp)

    Java 类名:org.alinklab.operator.stream.nlp.ReadUrlPageStreamOp

    Python 类名:ReadUrlPageStreamOp

    功能介绍

    读取URL网页

    参数说明

    名称 中文名称 描述 类型 是否必须? 取值范围 默认值
    contentCol 内容列名称 内容列名称 String
    printLimit 每个窗口内的最大输出条数 每个窗口内的最大输出条数 Integer null
    reservedCols 算法保留列名 算法保留列 String数组 null
    titleCol 标题列名称 标题列名称 String null
    urlCol URL列名称 URL列名称 String null

    代码示例

    Java 代码