环境部署

    • 环境中安装python2.7.12以上版本Python。
    • 数据库需要开启对PL/Python存储过程的支持。
    • 安装算法库需要拥有管理员权限的用户。

    操作步骤

    1. 检查部署Python环境。

      安装前,请查看系统安装的python版本,当前DeepSQL需要python2.7.12以上版本的环境。

      • 如果版本过低,或者无法安装python-devel包,可以下载最新python2源码,手动配置编译python2,并配置环境变量。

      算法库中,部分算法调用了python包,如numpy,pandas等。用户可以安装以下python库:

    2. 编译部署数据库。

      数据库需要开启对PL/Python存储过程的支持。默认编译数据库,不包含此模块。因此需要编译数据库时,在configure阶段,加入--with-python参数;

      其他编译保持步骤不变;

      编译完成后,需要重新gs_initdb;

      默认PL/Python存储过程模块不被加载,请执行“CREATE EXTENSION plpythonu”来加载模块。

    3. 将算法库安装到数据库中。

      a.进入{YOUR_MADLIB_INSTALL_FOLDER}路径。

      b.进入bin文件夹。

      c.执行如下命令。

      命令中参数说明如下:

      • -s:schema的名称。
      • -p:数据库平台,使用opengauss即可。
      • -c:连接数据库的参数。包括用户名、‘@’、IP地址、端口号和目标数据库名称。

      说明:

      • 目标数据库必须存在。
      • IP请使用127.0.0.1,不要使用localhost。
      • 数据库兼容性,推荐兼容性为B。不同的数据库兼容性下,对空值,NULL等处理有较大差异。建议使用B兼容性。例如,CREATE DATABASE dbcompatibility=’B’。