Alink教程(Java版)
该文档涉及的组件

Alink教程(Java版)的数据和资料链接


教程关联的数据和资料链接


第1章

链接1-1:Alink开源网址 https://github.com/alibaba/Alink

链接1-2:Alink文档 https://alinklab.cn/manual/index.html

链接1-3:Alink使用指南 https://alinklab.cn/tutorial/index.html

链接1-4:个人的知乎主页 https://www.zhihu.com/people/alink_pinshu

链接1-5:Java源代码地址 https://github.com/ALinkLab/alink_tutorial_java

链接1-6:鸢尾花(iris)数据集 http://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data

第3章

链接3-1:鸢尾花(iris)数据集下载 http://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data

链接3-2:葡萄酒品质数据集 http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-white.csv

链接3-3:LIBSVM格式介绍 https://www.csie.ntu.edu.tw/~cjlin/libsvm/index.html

链接3-4:Movielens 100K中的用户信息数据 http://files.grouplens.org/datasets/movielens/ml-100k/u.data

链接3-5:Libsvm格式的Iris数据 https://www.csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/multiclass/iris.scale

第4章

链接4-1:Flink Catalog API的详细介绍 https://ci.apache.org/projects/flink/flink-docs-release-1.11/dev/table/catalogs.html

第5章

链接5-1:Apache Calcite https://calcite.apache.org/

第6章

链接6-1:Movielens 100K中的用户信息数据 http://files.grouplens.org/datasets/movielens/ml-100k/u.data

第8章

链接8-1:在线画图网址 https://zh.numberempire.com/graphingcalculator.php

链接8-2:关于ROC的例子 http://baike.baidu.com/view/42249.htm

链接8-3:纸钞认证数据集 http://archive.ics.uci.edu/ml/datasets/banknote+authentication

第9章

链接9-1:Mushroom数据集 https://archive.ics.uci.edu/ml/machine-learning-databases/mushroom/agaricus-lepiota.data

第10章

链接10-1:德国信用数据集(German Credit Dataset) http://archive.ics.uci.edu/ml/datasets/Statlog+(German+Credit+Data)

第11章

链接11-1:行为日志数据 https://alink-release.oss-cn-beijing.aliyuncs.com/data-files/action_log.csv

链接11-2:AdaBoost算法论文 http://cseweb.ucsd.edu/~yfreund/papers/boostingexperiments.pdf

链接11-3:Gradient Boosting算法论文 http://statweb.stanford.edu/~jhf/ftp/trebst.pdf

第12章

链接12-1:鸢尾花(iris)数据集介绍 http://en.wikipedia.org/wiki/Iris_flower_data_set

链接12-2:鸢尾花(iris)数据集下载 http://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data

第13章

链接13-1:MNIST手写数字识别数据集 http://yann.lecun.com/exdb/mnist/

第14章

链接14-1:Kaggle比赛的Avazu CTR数据 https://www.kaggle.com/c/avazu-ctr-prediction/data

链接14-2:Avazu CTR数据的采样数据集(小规模) https://alink-release.oss-cn-beijing.aliyuncs.com/data-files/avazu-small.csv

链接14-3:Avazu CTR数据的采样数据集(8百万行) https://alink-release.oss-cn-beijing.aliyuncs.com/data-files/avazu-ctr-train-8M.csv

第15章

链接15-1:论文《遗传的身高向平均数方向的回归》网址 http://galton.org/essays/1880-1889/galton-1886-jaigi-regression-stature.pdf

链接15-2:父亲与儿子的身高记录数据集 https://www.kaggle.com/abhilash04/fathersandsonheight

第16章

链接16-1:葡萄酒品质数据集 http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-white.csv

第21章

链接21-1:今日头条新闻数据集 https://github.com/BenDerPan/toutiao-text-classfication-dataset/raw/master/toutiao_cat_data.txt.zip

链接21-2:LDA主题模型论文PDF版本网址 http://www.cs.princeton.edu/~blei/papers/BleiNgJordan2003.pdf

第22章

链接22-1:Wiki词向量预训练模型 http://u.cs.biu.ac.il/~yogo/data/syntemb/deps.words.bz2

链接22-2:Glove词向量预训练模型glove.6B http://nlp.stanford.edu/data/glove.6B.zip

链接22-3:《三国演义》文本文件的下载地址 https://github.com/tennessine/corpus

第23章

链接23-1:情感分析 http://ai.stanford.edu/~amaas/data/sentiment/aclImdb_v1.tar.gz

第24章

链接24-1:MovieLens 100K数据集下载地址 https://grouplens.org/datasets/movielens/100k/

链接24-2:MovieLens数据集下载地址 http://grouplens.org/datasets/movielens/

链接24-3:MovieLens数据文件地址 http://files.grouplens.org/datasets/movielens/

链接24-4:MovieLens 100K数据文件地址 http://files.grouplens.org/datasets/movielens/ml-100k/