程序问答   发布时间:2022-06-02  发布网站:大佬教程  code.js-code.com
大佬教程收集整理的这篇文章主要介绍了在 MPP 系统中使用 CREATE TABLE 组织/分发大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。

如何解决在 MPP 系统中使用 create table 组织/分发?

开发过程中遇到在 MPP 系统中使用 create table 组织/分发的问题如何解决?下面主要结合日常开发的经验,给出你关于在 MPP 系统中使用 create table 组织/分发的解决方法建议,希望对你解决在 MPP 系统中使用 create table 组织/分发有所启发或帮助;

MPP 系统(Netezza / Teradata / Synapse)中的 ORGANIZE BY / diStribute BY 子句对 create table 语句的性能有何影响? 另外,在这样的MPP系统中应该选择什么key来分发?

解决方法

简短的回答是,只要您选择的“分布”能够在节点之间实现非常均匀的行分布,那么它对插入性能几乎没有影响。

在 Netezza 上,创建表时不会强制执行“组织”,即使在插入/更新数据时也不强制执行。 Groom 操作稍后会根据您的要求执行此操作。旁注:在执行 CTAS 或大型插入时,如果可能,您应该在插入语句中“排序依据”。

关于选择“分布”列:

  1. 始终确保分布非常均匀(如果不可能:RANDOM 更好)
  2. 并且永远不要使用多于一列
  3. 并选择一个您计划对其进行大量“平等加入”的(很多)

关于选择“组织”列

  1. 虑您计划针对 (=,LIKE) 执行大量“简单 where”子句的列
  2. 倾向于那些几乎没有不同价值观的人
  3. 和“时间”列总是一个很好的猜测

提示:有时您会在某个列上获得“免费”组织效果,因为它与您已经在其上组织的另一列密切相关。 示例:如果在具有 5 年数据的表中,平均而言 create_date 与 END_DATE 相距不到 30 天,那么您将具有该效果

大佬总结

以上是大佬教程为你收集整理的在 MPP 系统中使用 CREATE TABLE 组织/分发全部内容,希望文章能够帮你解决在 MPP 系统中使用 CREATE TABLE 组织/分发所遇到的程序开发问题。

如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。