学大数据,都学习哪些内容,要学多久?( 二 )


Hive/Pig/SparkSQL:在计算引擎之上构建的支撑SQL或者脚本语言的分析系统 。大大降低了用户进行大数据分析的门槛 。
Mahout/MLib:在计算引擎上构建的机器学习库 。实现常用的机器学习和数据挖掘算法 。
Apache Beam/Cascading:基于各类计算框架而封装的高级API 。方便构建复杂的流水线 。