Skip to content
pengchao.zpc edited this page Nov 3, 2021 · 6 revisions

本项目是MaxCompute主要开源数据采集工具的集合,包括如下几个子项目。

从这些数据采集工具的实现技术上来看,Flume和OGG插件是基于DataHub的SDK实现的,而Sqoop,Kettle,presto-connector以及Hive Data Transfer UDTF是基于Tunnel的SDK实现的。DataHub和Tunnel分别是MaxCompute系统的实时和批量数据通道。这样,Flume插件和OGG插件是面向于实时数据传输的,而Sqoop,Kettle、presto-connector和Hive Data Transfer UDTF则是适合用于离线批量的数据传输。

Clone this wiki locally