Alink教程(Java版)
Alink教程(Python版)
该文档涉及的组件

第3章 文件系统与数据文件


勘误

1、如下截图,表3-7中对参数filePath的解释,应为“【必填】AK 格式文件的路径信息”。

答疑


1、这块怎么没有数据呢?

【问题】

如下截图所示,这块怎么没有数据呢?

【答复】

原因是流式任务没有运行,只是输出了结果的表头。流式任务需要显式的调用执行命令。添加如下语句:

StreamOperator.execute();



2、流式多并发读取数据文件乱序的问题

【问题】

如下截图所示,这块怎么没有数据呢?

看着应该是多并发度的时候无法维持分组内的时间是吗?使用的是csv文件数据源,流式过程。

【答复】

多并发(parallelism)读取CSV数据源时,会对文件分块,并发读各分块内容,这样读取出的数据顺序会发生变化。如果原始数据文件是按时间列排序的,单并发会按照文件的顺序读取数据,所以可以保持时序;多并发读取的数据顺序是乱的。