Apache Flink 编辑
Apache Flink是由Apache软件基金会开发的开源流处理软件框架,其核心是用JavaScala编写的分布式流数据流引擎。Flink以数据并行管道方式执行任意流数据程序,Flink的流水线运行时系统可以执行批处理任务和流处理程序。此外,Flink的运行时本身也支持迭代法的执行。
3
相关
Apache Beam是一个开源统一编程模型,用于定义和执行数据处理管道,包括ETL、批处理和流式处理。 Beam流水线是使用提供的SDK之一定义的,并在Beam支持的一个运行器中执行,包括Apache Apex、Apache Flink、Apache Gearpump、Apache Samza、Apache Spark和Google Cloud Dataflow。
XGBoost 是一个开源软件函式库,它为 C++、Java、Python、
R语言、和Julia提供了一个梯度提升技术框架,适用于Linux、Microsoft Windows、和
MacOS。 根据项目的描述,它的目的在于提供一个"可扩展、可移植和分布式梯度提升库"。 XGBoost除了可以在单一机器上运行,也支持运行在分布式框架Apache Hadoop、Apache Spark、Apache Flink
近几年,由于这个算法受到许多在机器学习竞赛中获奖团队的青睐,因而受到了广泛的欢迎和关注。