cdh spark _sql-匯編語言學習筆記

spark.read.jdbc(）的方式：package com.cn.sparkSqlimport java.util.Propertiesimport org.apache.spark.sql.SparkSessionobject Sparksql_mysql {def main(args: Array[String]): Unit = {val spark: SparkSession = SparkSession.builder().master(&

时间：2023-11-16 | 阅读：16

如何优化sql，spark sql 性能优化

一设置shuffle的并行度我们可以通过属性spark.sql.shuffle.partitions设置shuffle并行度二 Hive数据仓库建设的时候，合理设置数据类型，比如你设置成INT的就不要设置成BIGINT，减少数据类型不必要的内存开销三 SQL优化四并行的处理查询结果对于S

时间：2023-09-24 | 阅读：29

cdh hive on spark_Flink 与 Hive 的磨合期

有不少读者反馈，参考上篇文章《Hive 终于等来了 Flink》部署 Flink 并集成 Hive 时，出现一些 bug 以及兼容性等问题。虽已等来，却未可用。所以笔者增加了这一篇文章，作为姊妹篇。回顾在上篇文章中，笔者使用的 CDH 版本为 5.16.2，其

时间：2023-09-07 | 阅读：22

阅读排行