大规模数据集,高维数据,分布式计算,数据压缩,特征选择,机器学习