这个模块实现了一种数据类型cube
来表示多维立方体。
表 F.2展示了cube
类型有效的外部表示。x
、y
等表示浮点数。
表 F.2. 立方体外部表示
外部语法 | 含义 |
---|---|
| 一个一维点(或者长度为零的一维区间) |
( | 同上 |
| n-维空间中的一个点,内部表示为一个零容积立方体 |
( | 同上 |
( | 开始于x 并且结束于y 的一个一维区间,反之亦然。顺序并不重要
|
[( | 同上 |
( | 一个 n-维立方体,用它的对角顶点对表示 |
[( | 同上 |
一个立方体的对角录入的顺序无关紧要。如果需要创建一种统一的“左下 — 右上”的内部表示,cube
函数会自动地交换值。当角重合时,cube
只存储一个角和一个“is point”标志,这样避免浪费空间。
输入中的空白空间会被忽略,因此[(
与x
),(y
)][ (
相同。
x
), ( y
) ]
值在内部被存储为 64 位浮点数。这意味着超过 16 位有效位的数字将被截断。
表 F.3展示了为类型cube
提供的操作符。
表 F.3. 立方体操作符
操作符 | 结果 | 描述 |
---|---|---|
a = b | boolean | 立方体 a 和 b 相同。 |
a && b | boolean | 立方体 a 和 b 重叠。 |
a @> b | boolean | 立方体 a 包含 立方体 b。 |
a <@ b | boolean | 立方体 a 被包含在立方体 b 中。 |
a < b | boolean | 立方体 a 小于立方体 b。 |
a <= b | boolean | 立方体 a 小于或者等于立方体 b。 |
a > b | boolean | 立方体 a 大于立方体 b。 |
a >= b | boolean | 立方体 a 大于或者等于立方体 b。 |
a <> b | boolean | 立方体 a 不等于立方体 b。 |
a -> n | float8 | 得到立方体的第n 个坐标(从 1 开始数)。 |
a ~> n | float8 |
以下列方式获取多维数据集的第n 个坐标:
n = 2 * k - 1表示第k 维度的下限,
n = 2 * k表示第k 维度的上限。
负的n 表示相应正坐标的倒数值。此运算符专为KNN-GiST支持而设计。
|
a <-> b | float8 | a 和 b 之间的欧氏距离。 |
a <#> b | float8 | a 和 b 之间的直线距离(taxicab 距离,L1 度量)。 |
a <=> b | float8 | a 和 b 之间的切比雪夫(L-inf 度量)距离。 |
(在 PostgreSQL 8.2 之前,包含操作符@>
和<@
分别被称为@
和~
。这些名称仍然可用,但是已经被废弃并且最终将会退休。注意旧的名字与之前核心几何数据类型遵循的习惯相反!)
标量排序操作符(<
、>=
等)除了用来排序之外没有什么实际用途。这些操作符首先比较第一个坐标,如果它们相等再比较第二个坐标等等。它们主要为支持cube
的 b-树索引操作符类而存在,这类操作符对支持cube
列上的 UNIQUE 约束等很有用。
cube
模块也为cube
值提供了一个 GiST 索引操作符类。cube
GiST 索引可以被用于在WHERE
子句中通过=
、&&
、@>
以及<@
操作符来搜索值。
此外,cube
GiST 索引可以被用在ORDER BY
子句中通过度量操作符<->
、<#>
和<=>
来查找最近邻。例如, 3-D 点(0.5, 0.5, 0.5)的最近邻可以用下面的查询很快地找到:
SELECT c FROM test ORDER BY c <-> cube(array[0.5,0.5,0.5]) LIMIT 1;
也可以用这种方式使用~>
操作符来高效地检索通过选定坐标排序后的前几个值。例如,可以用下面的查询得到通过第一个坐标(左下角)升序排列后的前几个立方体:
SELECT c FROM test ORDER BY c ~> 1 LIMIT 5;
以及得到通过右上角第一个坐标降序排列后的 2-D 立方体:
SELECT c FROM test ORDER BY c ~> 3 DESC LIMIT 5;
表 F.4展示了可用的函数。
表 F.4. 立方体函数
函数 | 结果 | 描述 | 例子 |
---|---|---|---|
cube(float8) | cube | 制造一个一维立方体,坐标都是相同的。 |
cube(1) == '(1)'
|
cube(float8, float8) | cube | 制造一个一维立方体。 |
cube(1,2) == '(1),(2)'
|
cube(float8[]) | cube | 使用数组定义的坐标制造一个零容积的立方体。 |
cube(ARRAY[1,2]) == '(1,2)'
|
cube(float8[], float8[]) | cube | 用由两个数组定义的右上和左下坐标制造一个立方体,两个数组必须等长。 |
cube(ARRAY[1,2], ARRAY[3,4]) == '(1,2),(3,4)'
|
cube(cube, float8) | cube | 在一个现有的立方体上增加一维来制造一个新立方体,对新坐标的各个端点都采用相同的值。这可以用于从计算得到的值逐渐地构建立方体。 |
cube('(1,2),(3,4)'::cube, 5) == '(1,2,5),(3,4,5)'
|
cube(cube, float8, float8) | cube | 在一个现有的立方体上增加一维来制造一个新立方体。这可以用于从计算得到的值逐渐地构建立方体。 |
cube('(1,2),(3,4)'::cube, 5, 6) == '(1,2,5),(3,4,6)'
|
cube_dim(cube) | integer | 返回该立方体的维数 |
cube_dim('(1,2),(3,4)') == '2'
|
cube_ll_coord(cube, integer) | float8 | 返回一个立方体的左下角的第 n 个坐标值
|
cube_ll_coord('(1,2),(3,4)', 2) == '2'
|
cube_ur_coord(cube, integer) | float8 | 返回一个立方体的右上角的第n 个坐标值
|
cube_ur_coord('(1,2),(3,4)', 2) == '4'
|
cube_is_point(cube) | boolean | 如果一个立方体是一个点则返回真,也就是两个定义点相同。 | |
cube_distance(cube, cube) | float8 | 返回两个立方体之间的距离。如果两个都是点,这就是普通距离函数。 | |
cube_subset(cube, integer[]) | cube | 从一个现有的立方体制造一个新立方体,使用来自于一个数组的维索引列表。它可以被用来抽取一个单一维度的端点,或者它可以被用来去除维度,或者按照需要对它们重新排序。 |
cube_subset(cube('(1,3,5),(6,7,8)'), ARRAY[2]) == '(3),(7)'
cube_subset(cube('(1,3,5),(6,7,8)'), ARRAY[3,2,1,1]) ==
'(5,3,1,1),(8,7,6,6)'
|
cube_union(cube, cube) | cube | 产生两个立方体的并 | |
cube_inter(cube, cube) | cube | 产生两个立方体的交 | |
cube_enlarge(c cube, r double, n integer) | cube | 用一个指定的半径r 在至少n 个维度上增加立方体的尺寸。如果该半径是负值,则该立方体会收缩。这有助于围绕一个点创建一个外包盒来搜索附近点。所有已定义的维度都会按照半径r 被改变。左下坐标按照r 被减小并且右上坐标按照r 被增加。如果一个左下坐标被增加得超过对应的右上坐标(这只会发生在r < 0 时),则两个坐标会被设置为它们的均值。如果n 大于已定义的维度数并且该立方体被增加(r >= 0), 则额外的维度会被加入以让维度数达到n ,对于额外的坐标将使用 0 作为初始值。这个函数可用来创建围绕一个点的外包盒以搜索临近点。
|
cube_enlarge('(1,2),(3,4)', 0.5, 3) ==
'(0.5,1.5,-0.5),(3.5,4.5,0.5)'
|
我相信这个并:
select cube_union('(0,5,2),(2,3,1)', '0'); cube_union ------------------- (0, 0, 0),(2, 5, 2) (1 row)
不会与常识矛盾,下面的交也不会
select cube_inter('(0,-1),(1,1)', '(-2),(2)'); cube_inter ------------- (0, 0),(1, 0) (1 row)
在所有不同维度立方体的二元操作中,我假定低纬度的那一个要做笛卡尔投影,即为字符串表示中被省略的坐标取零。上面的例子等同于:
cube_union('(0,5,2),(2,3,1)','(0,0,0),(0,0,0)'); cube_inter('(0,-1),(1,1)','(-2,0),(2,0)');
下列包含谓词使用点语法,不过实际上第二个参数在内部被表示为一个盒子。这种语法让我们不必定义一种单独的点类型以及用于(盒子, 点)谓词的函数。
select cube_contains('(0,0),(1,1)', '0.5,0.5'); cube_contains -------------- t (1 row)
用法的例子可见回归测试sql/cube.sql
。
为了不容易出问题,对于立方体的维度数有 100 的限制。如果你想要更大的立方体,可以在cubedata.h
中修改。
原作者:Gene Selkov, Jr. <[email protected]>
,数学与计算机科学部,阿尔贡国家实验室。
我的感谢主要要献给 Joe Hellerstein 教授(http://db.cs.berkeley.edu/jmh/),他阐明了 GiST (http://gist.cs.berkeley.edu/),还要送给他以前的学生 Andy Dong,他为 Illustra 编写了例子。我也对所有的 Postgres 开发者(现在的和以前的)心存感激,他们让我能够创造自己的世界并且宁静地生活在其中。我也要感谢阿尔贡实验室和美国能源局对我多年数据库研究的支持。
这个包的小更新由 Bruno Wolff III <[email protected]>
于 2002 年 8/9 月完成。这些修改包括将精度从单精度改为双精度以及增加了一些新的函数。
额外的更新由 Joshua Reich <[email protected]>
在 2006 年 7 月做出。其中包括cube(float8[], float8[])
并且将代码从废弃的 V0 协议改到 V1 调用协议。