概览
更新时间:2025-05-26
创建表
使用 CREATE TABLE 语句在 PALO 中创建一个表,也可以使用 CREATE TABKE LIKE 或 CREATE TABLE AS 子句从另一个表派生表定义。
表名
PALO 中表名默认是大小写敏感的,可以在第一次初始化集群时配置lower_case_table_names为大小写不敏感的。默认的表名最大长度为 64 字节,可以通过配置table_name_length_limit更改,不建议配置过大。创建表的语法请参考CREATE TABLE。
表属性
PALO 的建表语句中可以指定建表属性,包括:
- 分桶数 (buckets):决定数据在表中的分布;
- 存储介质 (storage_medium):控制数据的存储方式,如使用 HDD、SSD 或远程共享存储;
- 副本数 (replication_num):控制数据副本的数量,以保证数据的冗余和可靠性;
- 冷热分离存储策略 (storage_policy) :控制数据的冷热分离存储的迁移策略;
这些属性作用于分区,即分区创建之后,分区就会有自己的属性,修改表属性只对未来创建的分区生效,对已经创建好的分区不生效,关于属性更多的信息请参考修改表属性。
注意事项
- 选择合适的数据模型:数据模型不可更改,建表时需要选择一个合适的数据模型;
- 选择合适的分桶数:已经创建的分区不能修改分桶数,可以通过替换分区来修改分桶数,可以修改动态分区未创建的分区分桶数;
- 添加列操作:加减 VALUE 列是轻量级实现,秒级别可以完成,加减 KEY 列或者修改数据类型是重量级操作,完成时间取决于数据量,大规模数据下尽量避免加减 KEY 列或者修改数据类型;
- 优化存储策略:可以使用层级存储将冷数据保存到 HDD 或者 S3 / HDFS。