大佬教程收集整理的这篇文章主要介绍了在 MPP 系统中使用 CREATE TABLE 组织/分发,大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。
MPP 系统(Netezza / Teradata / Synapse)中的 ORGANIZE BY / diStribute BY 子句对 create table 语句的性能有何影响? 另外,在这样的MPP系统中应该选择什么key来分发?
简短的回答是,只要您选择的“分布”能够在节点之间实现非常均匀的行分布,那么它对插入性能几乎没有影响。
在 Netezza 上,创建表时不会强制执行“组织”,即使在插入/更新数据时也不强制执行。 Groom 操作稍后会根据您的要求执行此操作。旁注:在执行 CTAS 或大型插入时,如果可能,您应该在插入语句中“排序依据”。
关于选择“分布”列:
关于选择“组织”列
提示:有时您会在某个列上获得“免费”组织效果,因为它与您已经在其上组织的另一列密切相关。 示例:如果在具有 5 年数据的表中,平均而言 create_date 与 END_DATE 相距不到 30 天,那么您将具有该效果
以上是大佬教程为你收集整理的在 MPP 系统中使用 CREATE TABLE 组织/分发全部内容,希望文章能够帮你解决在 MPP 系统中使用 CREATE TABLE 组织/分发所遇到的程序开发问题。
如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。