数据源管理

    数据源的类型

    数据源分为内部(INTERAL)和外部(EXTERAL)两种类型。

    内部数据源

    内部数据源类型目前主要支持mysql,主要针对企业内部系统。

    在创建内部数据模型时,需要选择内部数据源,在此数据源上创建数据模型。

    在数据集成步骤中,指定从那个数据源中集成数据。

    数据源管理 - 图2

    外部数据源

    外部数据源除支持mysql外,还支持Oracle,DB2,CUSTOM,HANA,POSTGRESQL,KAFKA,ODPS等类型,后续可以根据客户需求来新增支持的数据类型,主要针对外部客户所提供的数据。

    外部数据源和内部数据源一样,同样可以在创建外部数据模型,数据集成中使用,另外在数据导出中只能选择外部数据源进行导出

    1.在数据源管理界面中选择新增数据源:

    1)选择创建数据源的分类,此处选择EXTERAL进行举例;

    2)选择数据源的类型,此处选择mysql。

    2.选择类型后,需要对数据库进行连接配置,如下:

    数据源管理 - 图5

    3.测试 : 点击测试连接,确保数据源能连通。

    如测试失败,可检查用户名或者密码是否配置失误,一般是以下几项配置错误造成:

    成功后保存则可在数据源管理中看到配置好的数据源。

    Kafka 的导出数据源配置

    基础的配置如下:

    数据源管理 - 图7

    针对特定需求要做配置修改。

    如果需要写入的数据覆盖,去重,则建的模型指定对应的字段为主键。

    本次导入的索引和类型信息在描述中添加

    ODPS 的导出数据源配置

    基础配置如下

    数据源管理 - 图9

    链接地址填写endpoint信息;

    数据库名称填写 projectName;

    用户名 :对方提供的id或者称为ak;

    密码 : 对方提供的secret 或者称为sk;

    导出的模型名与maxcompute的tableName一致。

    使用场景限制:同一个数据库下,有多张表,多张表表名均为 ABC_数字 。

    格式:1.ABC相同(ABC中可以包含下划线);2.数字连续。

    tablePrefix 代表表名的前缀。

    tableMin 代表开始的后缀。

    tableMax 代表结束的后缀。

    对于这种数据源,在配置数据模型时,只需配置一个数据模型即可,模型名为上文提到的ABC部分,不需要加后面的数字部分。在配置数据集成节点且运行后,上述所有表中的数据会集成到同一张表中。

    对数据源名称,分类,类型,数据源标示等一个或多个填写后进行搜索

    数据源管理 - 图11