Java 类名:com.alibaba.alink.operator.batch.pytorch.TorchModelPredictBatchOp
Python 类名:TorchModelPredictBatchOp
加载 TorchScript 模型进行预测。
模型路径modelPath需要是一个通过 torch.jit 导出的模型文件路径。
参与模型预测的数据通过参数 selectedCols 设置,需要注意以下几点:
模型输出信息通过参数 outputSchemaStr 指定,包括输出列名以及名称,需要注意以下几点:
组件使用的是 PyTorch 1.8.1 CPU 版本,如果需要使用 GPU 功能,可以自行替换插件文件。
在 Windows 下运行时,如果遇到 UnsatisfiedLinkError,请下载 Visual C++ 2015 Redistributable Packages 并重启,然后重新运行。
| 名称 | 中文名称 | 描述 | 类型 | 是否必须? | 取值范围 | 默认值 |
|---|---|---|---|---|---|---|
| modelPath | 模型的URL路径 | 模型的URL路径 | String | ✓ | ||
| outputSchemaStr | Schema | Schema。格式为“colname coltype[, colname2, coltype2[, …]]”,例如 “f0 string, f1 bigint, f2 double” | String | ✓ | ||
| selectedCols | 选择的列名 | 计算列对应的列名列表 | String[] | ✓ | ||
| intraOpParallelism | Op 间并发度 | Op 间并发度 | Integer | 4 | ||
| reservedCols | 算法保留列名 | 算法保留列 | String[] | null |
模型路径可以是以下形式:
** 以下代码仅用于示意,可能需要修改部分代码或者配置环境后才能正常运行!**
test = AkSourceBatchOp()\
.setFilePath("https://alink-release.oss-cn-beijing.aliyuncs.com/data-files/mnist_test_vector.ak");
test = VectorToTensorBatchOp()\
.setTensorDataType("float")\
.setTensorShape([1, 1, 28, 28])\
.setSelectedCol("vec")\
.setOutputCol("tensor")\
.setReservedCols(["label"])\
.linkFrom(test)
predictor = TorchModelPredictBatchOp()\
.setModelPath("https://alink-release.oss-cn-beijing.aliyuncs.com/data-files/mnist_model_pytorch.pt")\
.setSelectedCols(["tensor"])\
.setOutputSchemaStr("probabilities FLOAT_TENSOR")
test = predictor.linkFrom(test).select("label, probabilities")
test.print()
import com.alibaba.alink.operator.batch.BatchOperator;
import com.alibaba.alink.operator.batch.dataproc.VectorToTensorBatchOp;
import com.alibaba.alink.operator.batch.pytorch.TorchModelPredictBatchOp;
import com.alibaba.alink.operator.batch.source.AkSourceBatchOp;
import org.junit.Test;
public class TorchModelPredictBatchOpTest {
@Test
public void testTorchModelPredictBatchOp() throws Exception {
BatchOperator.setParallelism(1);
BatchOperator <?> test = new AkSourceBatchOp()
.setFilePath("https://alink-release.oss-cn-beijing.aliyuncs.com/data-files/mnist_test_vector.ak");
test = new VectorToTensorBatchOp()
.setTensorDataType("float")
.setTensorShape(1, 1, 28, 28)
.setSelectedCol("vec")
.setOutputCol("tensor")
.setReservedCols("label")
.linkFrom(test);
BatchOperator <?> predictor = new TorchModelPredictBatchOp()
.setModelPath("https://alink-release.oss-cn-beijing.aliyuncs.com/data-files/mnist_model_pytorch.pt")
.setSelectedCols("tensor")
.setOutputSchemaStr("probabilities FLOAT_TENSOR");
test = predictor.linkFrom(test).select("label, probabilities");
test.print();
}
}