Greenplum 特点概要

    上级话题: Greenplum数据库参考指南

    SQL语言于1986年被美国国家标准学会(ANSI)第一次作为SQL正式标准化。SQL标准的后续版本已由ANSI和国际标准化组织(ISO)标准发布:SQL 1989,SQL 1992,SQL 1999,SQL 2003,SQL 2006,和最后的 SQL 2008,它就是当前的SQL标准。该标准的正式名称为 ISO/IEC 9075-14:2008。一般来说,每个更新的版本都增加了更多的内容,虽然偶尔也有一些内容被启用或者删除。

    重要的是要注意,没有完全遵从SQL标准的商业数据库系统。Greenplum数据库几乎完全符合SQL 1992的标准,多数功能来源于SQL 1999。几个来源于SQL 2003的功能也被实现了(最著名的是 SQL OLAP 功能)。

    该部分针对Greenplum数据库和SQL标准相关的重要一致性的问题。有关对最新的SQL标准的支持功能列表,请参阅 。

    在构建并行,无共享架构的数据库系统和查询优化器的过程中,某些常见的SQL结构尚未在Greenplum 数据库中实现。不支持以下的SQL结构:

    1. 有些设置在 EXISTS 或 NOT EXISTS 子句中返回子查询,Greenplum的并行优化器不能将之重写为到连接之中。
    2. 向后回滚游标,包括 FETCH PRIOR,FETCH FIRST,FETCH ABOLUTE,和 FETCH RELATIVE操作的使用。
    3. 在 CREATE TABLE 语句上(哈希分布表):UNIQUE 或 PRIMARY KEY 子句必须包括分布键列的所有值,或者是其超集。因为这个限制,在CREATE TABLE的语句中,仅允许一个 UNIQUE 子句或者 PRIMARY KEY 子句。UNIQUE 或 PRIMARY KEY 子句不允许出现在随机分布的表中。
    4. CREATE UNIQUE INDEX 语句不包含分布键的列的所有值或者为其超集。CREATE UNIQUE INDEX不允许使用在随机分布的表上。

      注意 UNIQUE INDEXES(但是不是 UNIQUE CONSTRAINTS)在分布表的单个部分上执行,它们保证每个部分或者字部分内的键值的唯一性。

    5. VOLATILE 或 STABLE 函数不能在段上执行,因此限于将文字值作为其参数值传递。

    6. 触发器是不支持的,因为他么通常依赖于 VOLATILE 函数的使用。
    7. 引用完整性约束(外键)不会再Greenplum数据库中实施。用户可以声明外键,但是这些信息保存在系统目录中。
    8. 序列操纵函数 CURRVAL 和 LASTVAL。

    以下 SQL 1992 的功能在Greenplum数据库中不支持:

    1. CREATE ASSERTION 语句。
    2. INTERVAL 文字在Greenplum数据库中是支持的, 但是不符合标准。
    3. GET DIAGNOSTICS 语句。
    4. 对列 GRANT INSERT 或 UPDATE 权限。在Greenplum数据库中权限只能赋予在表上。
    5. GLOBAL TEMPORARY TABLEs 和 LOCAL TEMPORARY TABLEs. Greenplum TEMPORARY TABLEs 不符合SQL标准,但是很多商业数据库以同样的方式实现了临时表。Greenplum 临时表和Terdata中的 VOLATILE TABLEs 一样。
    6. UNIQUE 断言。
    7. 引用完整性检查的 MATCH PARTIAL (很可能不会在Greenplum数据库中实现)。

    以下 SQL 1999 的功能在Greenplum数据库中不支持:

    1. Large Object 数据类型:BLOBCLOB, NCLOB。但是,Grennplum数据库中该 BYTEA 和 TEXT 列可以存储大量的数据(数百兆字节)。
    2. MODULE(SQL 客户端模块)。
    3. CREATE PROCEDURE(SQL/PSM)。这可通过创建返回值为void的FUNCTION 在Greenplum数据库中进行操作,如下调用函数:

    4. 该 PostgreSQL/Greenplum 函数定义语言 (PL/PGSQL)是Oracle的 PL/SQL的子集,而不是和 SQL/PSM 函数定义语言的兼容。 Greenplum数据库还支持使用 Python,Perl,Java,和 R定义函数。

    5. BIT 和 BIT VARYING 数据类型 (故意生路)。这些在 SQL 2003中被弃用,并且在 SQL 2008中被替代。
    6. Greenplum 63个字符长的标识符。该SQL标准要求支持达到128个字符长的标识符。
    7. 准备好的事务(PREPARE TRANSACTION, COMMIT PREPARED, ROLLBACK PREPARED)。这也意味着 Greenplum 不支持 XA 事务(数据库事务和外部事务2个阶段的提交的协调)。
    8. CHARACTER SET 选项,在 CHAR() 或 VARCHAR() 列定义的时候。
    9. 指明 CHARACTERS 或 OCTETS (BYTES)关于 CHAR() 或 VARCHAR() 列的长度。例如,VARCHAR(15 CHARACTERS) 或 VARCHAR(15 OCTETS) 或 VARCHAR(15 BYTES)。
    10. CURRENT_SCHEMA 函数。
    11. 显式表 结构。

    以下 SQL 2003 的功能在Greenplum数据库中不支持:

    1. MERGE 语句。
    2. IDENTITY 列和相关的 GENERATED ALWAYS/GENERATED BY DEFAULT 子句。该 SERIAL 或 BIGSERIAL 数据类型 INT 或 BIGINT GENERATED BY DEFAULT AS IDENTITY非常相似。
    3. MULTISET 对数据类型的修饰符。
    4. ROW 数据类型。
    5. Greenplum 使用序列的语法是非标准的。例如,nextval(’seq’) 在 Greenplum 中使用来替代标准的 NEXT VALUE FOR seq。
    6. GENERATED ALWAYS AS 列。视图可以用来解决。
    7. SELECT语句上的示例子句(TABLESAMPLE)。该 random() 函数可以用解决从表中获取随机样本的方法。
    8. partitioned join tables结构(连接中的 PARTITION BY )。
    9. GRANT SELECT 对列授权。Greenplum数据库中权限只能赋予表。视图可以用来解决。
    10. 对 CREATE TABLE x (LIKE(y)) 语句,Greenplum 不支持 [INCLUDING|EXCLUDING][DEFAULTS|CONSTRAINTS|INDEXES] 语句。
    11. Greenplum 数组数据类型几乎符合SQL标准,但是有一些例外,通常,用户不应该遇到使用它们的问题。

    以下SQL 2008的功能在Greenplum数据库中不支持:

    1. BINARY 和 VARBINARY 数据类型。 在Greenplum数据库中,BYTEA 可以用来替代 VARBINARY。
    2. FETCH FIRST 或 FETCH NEXT 子句对 SELECT,例如:

      1. NEXT 10 ROWS ONLY;

      Greenplum 有 LIMIT 和 LIMIT OFFSET 子句可以用来替代。

    3. 该 ORDER BY 子句在视图中或子查询中会被忽视,除非也使用了 LIMIT 子句。这是可选的,正如 Greenplum 优化器不能决定什么时候可以安全的避免呢排序,可能会导致未知的性能影响因为 ORDER BY 子句。要解决这个问题,用户可以指定一个非常大的 LIMIT。例如: SELECT * FROM mytable ORDER BY 1 LIMIT 9999999999

    4. TRUNCATE TABLE 不接受 CONTINUE IDENTITY 和 RESTART IDENTITY 子句。

    Greenplum 和 PostgreSQL 兼容性

    Greenplum数据库是基于 PostgreSQL 8.3 的,并且带有一些新PostgreSQL版本的一些功能。要支Greenplum数据库持分布式的特点和常规的工作负载,一些SQL命令已经被添加和修改,但是仍然还有一些PostgreSQL的功能不支持。Greenplum还添加了PostgreSQL不支持的功能,例如物理数据分布,并行查询优化,外部表,负载管理的资源队列和增强的表分区。更多关于完整的SQL语法和引用,请参阅 。