函数
在本节中,我们将讨论常规函数。 有关聚合函数,请参阅«聚合函数»一节。
* - ’arrayJoin’函数与表函数均属于第三种类型的函数。 *
与标准SQL相比,ClickHouse具有强类型。 换句话说,它不会在类型之间进行隐式转换。 每个函数适用于特定的一组类型。 这意味着有时您需要使用类型转换函数。
常见的子表达式消除
查询中具有相同AST(相同语句或语法分析结果相同)的所有表达式都被视为具有相同的值。 这样的表达式被连接并执行一次。 通过这种方式也可以消除相同的子查询。
结果类型
为了简单起见,某些函数的某些参数只能是常量。 例如,LIKE运算符的右参数必须是常量。
几乎所有函数都为常量参数返回常量。 除了用于生成随机数的函数。
’now’函数为在不同时间运行的查询返回不同的值,但结果被视为常量,因为常量在单个查询中很重要。
常量表达式也被视为常量(例如,LIKE运算符的右半部分可以由多个常量构造)。
对于常量和非常量参数,可以以不同方式实现函数(执行不同的代码)。 但是,对于包含相同数据的常量和非常量参数它们的结果应该是一致的。
NULL值处理
函数具有以下行为:
- 如果函数的参数至少一个是«NULL»,则函数结果也是«NULL»。
- 在每个函数的描述中单独指定的特殊行为。在ClickHouse源代码中,这些函数具有«UseDefaultImplementationForNulls = false»。
不可变性
函数不能更改其参数的值 - 任何更改都将作为结果返回。因此,计算单独函数的结果不依赖于在查询中写入函数的顺序。
表达式参数的计算
在几乎所有编程语言中,某些函数可能无法预先计算其中一个参数。这通常是运算符,||
和? :
。
但是在ClickHouse中,函数(运算符)的参数总是被预先计算。这是因为一次评估列的整个部分,而不是分别计算每一行。
执行分布式查询处理的功能
对于分布式查询处理,在远程服务器上执行尽可能多的查询处理阶段,并且在请求者服务器上执行其余阶段(合并中间结果和之后的所有内容)。
这意味着可以在不同的服务器上执行功能。
例如,在查询
- 如果
distributed_table
只有一个分片,则在该分片的服务器上执行所有’f’,’g’和’h’功能。
函数的结果通常不依赖于它在哪个服务器上执行。但是,有时这很重要。
例如,使用字典的函数时将使用运行它们的服务器上存在的字典。
另一个例子是函数,它返回运行它的服务器的名称,以便在SELECT
查询中对服务器进行GROUP BY
。