feat: optimizing partition compute (#77)

yuanoOo · web-flow · commit a143f612affd · 2025-09-22T16:50:34.000+08:00
* BugFix: Fixed a bug in collecting statistics in parallel at the partition level

* feat: add jdbc.partition-compute-parallelism option

* Optimize partition computation parallelism logic and documentation

- Optimize partition computation parallelism logic in OBMySQLPartition to dynamically adjust based on partition count and user configuration
- Replace Chinese comments with English comments
- Update documentation for jdbc.partition-compute-parallelism parameter to highlight driver node execution and performance tuning recommendations
diff --git a/docs/spark-catalog-oceanbase.md b/docs/spark-catalog-oceanbase.md
@@ -352,6 +352,13 @@ Precautions for direct-load:
                 <td>Int</td>
                 <td>Controls the parallelism level for statistical queries (e.g., COUNT, MIN, MAX) by adding /*+ PARALLEL(N) */ hint to generated SQL.</td>
             </tr>
+            <tr>
+                <td>spark.sql.catalog.your_catalog_name.jdbc.partition-compute-parallelism</td>
+                <td>No</td>
+                <td style="word-wrap: break-word;">32</td>
+                <td>Int</td>
+                <td>Controls the parallelism level for partition computation. This parameter determines the number of threads used when computing partitions for partitioned tables (mainly through parallel SQL queries to OceanBase partition statistics). The computation task runs on the driver node. Higher values can improve performance for tables with many partitions. When setting a larger value for this parameter, appropriately increasing the CPU cores and memory of the driver node can achieve better performance.</td>
+            </tr>
             <tr>
                 <td>spark.sql.catalog.your_catalog_name.jdbc.query-timeout-hint-degree</td>
                 <td>否</td>
diff --git a/docs/spark-catalog-oceanbase_cn.md b/docs/spark-catalog-oceanbase_cn.md
@@ -348,6 +348,13 @@ select * from spark_catalog.default.orders;
                 <td>Int</td>
                 <td>通过向生成的 SQL 添加 /*+ PARALLEL(N) */ hint 来控制统计查询（例如 COUNT、MIN、MAX）的并行级别。</td>
             </tr>
+            <tr>
+                <td>spark.sql.catalog.your_catalog_name.jdbc.partition-compute-parallelism</td>
+                <td>否</td>
+                <td style="word-wrap: break-word;">32</td>
+                <td>Int</td>
+                <td>控制分区计算的并行级别。此参数确定计算分区表分区时使用的线程数，主要通过并行 SQL 查询 OceanBase 分区统计信息来实现。该计算任务在 driver 节点运行，对于分区数量较多的表，设置更高的值可以显著提升性能。当指定的该参数值较大的时候，适当调大 driver 节点的 CPU 核数和内存，可以取得更好的性能。</td>
+            </tr>
             <tr>
                 <td>spark.sql.catalog.your_catalog_name.jdbc.query-timeout-hint-degree</td>
                 <td>否</td>
diff --git a/spark-connector-oceanbase/spark-connector-oceanbase-3.1/src/main/scala/com/oceanbase/spark/reader/v2/OBJdbcReader.scala b/spark-connector-oceanbase/spark-connector-oceanbase-3.1/src/main/scala/com/oceanbase/spark/reader/v2/OBJdbcReader.scala
@@ -51,6 +51,13 @@ class OBJdbcReader(
   private lazy val stmt: PreparedStatement =
     conn.prepareStatement(buildQuerySql(), ResultSet.TYPE_FORWARD_ONLY, ResultSet.CONCUR_READ_ONLY)
   private lazy val rs: ResultSet = {
+    partition match {
+      case part: OBMySQLPartition =>
+        part.unevenlyWhereValue.zipWithIndex.foreach {
+          case (value, index) => stmt.setObject(index + 1, value)
+        }
+      case _ =>
+    }
     stmt.setFetchSize(config.getJdbcFetchSize)
     stmt.setQueryTimeout(config.getJdbcQueryTimeout)
     stmt.executeQuery()
@@ -96,16 +103,23 @@ class OBJdbcReader(
         .map(p => s"($p)")
         .mkString(" AND ")
 
-    val whereClause: String = {
-      if (filterWhereClause.nonEmpty) {
+    val part: OBMySQLPartition = partition.asInstanceOf[OBMySQLPartition]
+    val whereClause = {
+      if (part.whereClause != null && filterWhereClause.nonEmpty) {
+        "WHERE " + s"($filterWhereClause)" + " AND " + s"(${part.whereClause})"
+      } else if (part.whereClause != null) {
+        "WHERE " + part.whereClause
+      } else if (filterWhereClause.nonEmpty) {
         "WHERE " + filterWhereClause
       } else {
         ""
       }
     }
-    val part: OBMySQLPartition = partition.asInstanceOf[OBMySQLPartition]
+    val hint =
+      s"/*+ PARALLEL(${config.getJdbcParallelHintDegree}) */"
+
     s"""
-       |SELECT $columnStr FROM ${config.getDbTable} ${part.partitionClause}
+       |SELECT $hint $columnStr FROM ${config.getDbTable} ${part.partitionClause}
        |$whereClause ${part.limitOffsetClause}
        |""".stripMargin
   }
diff --git a/spark-connector-oceanbase/spark-connector-oceanbase-base/src/main/java/com/oceanbase/spark/config/OceanBaseConfig.java b/spark-connector-oceanbase/spark-connector-oceanbase-base/src/main/java/com/oceanbase/spark/config/OceanBaseConfig.java
@@ -273,6 +273,14 @@ public class OceanBaseConfig extends Config implements Serializable {
                     .intConf()
                     .createWithDefault(4);
 
+    public static final ConfigEntry<Integer> JDBC_PARTITION_COMPUTE_PARALLELISM =
+            new ConfigBuilder("jdbc.partition-compute-parallelism")
+                    .doc(
+                            "Controls the parallelism level for partition computation. This parameter determines the number of threads used when computing partitions for partitioned tables. Higher values can improve performance for tables with many partitions.")
+                    .version(ConfigConstants.VERSION_1_3_0)
+                    .intConf()
+                    .createWithDefault(32);
+
     public static final ConfigEntry<Long> JDBC_MAX_RECORDS_PER_PARTITION =
             new ConfigBuilder("jdbc.max-records-per-partition")
                     .doc(
@@ -533,6 +541,10 @@ public Integer getJdbcStatsParallelHintDegree() {
         return get(JDBC_STATISTICS_PARALLEL_HINT_DEGREE);
     }
 
+    public Integer getJdbcPartitionComputeParallelism() {
+        return get(JDBC_PARTITION_COMPUTE_PARALLELISM);
+    }
+
     public Optional<Long> getJdbcMaxRecordsPrePartition() {
         return Optional.ofNullable(get(JDBC_MAX_RECORDS_PER_PARTITION));
     }
diff --git a/spark-connector-oceanbase/spark-connector-oceanbase-base/src/main/scala/com/oceanbase/spark/reader/v2/OBMySQLPartition.scala b/spark-connector-oceanbase/spark-connector-oceanbase-base/src/main/scala/com/oceanbase/spark/reader/v2/OBMySQLPartition.scala
@@ -25,12 +25,12 @@ import org.apache.spark.sql.connector.read.InputPartition
 
 import java.sql.Connection
 import java.util.{Objects, Optional}
+import java.util.concurrent.{Executors, TimeUnit}
 import java.util.concurrent.TimeUnit
 
 import scala.collection.mutable
 import scala.collection.mutable.ArrayBuffer
-import scala.concurrent.{Await, Future}
-import scala.concurrent.ExecutionContext.Implicits.global
+import scala.concurrent.{Await, ExecutionContext, Future}
 import scala.concurrent.duration.Duration
 
 /** Data corresponding to one partition of a JDBCLimitRDD. */
@@ -147,7 +147,7 @@ object OBMySQLPartition extends Logging {
       computeUnevenlyWherePartInfoForNonPartTable(connection, config, priKeyColumnName)
     } else {
       // For partition table
-      computeUnevenlyWherePartInfoForPartTable(connection, config, obPartInfos, priKeyColumnName)
+      computeUnevenlyWherePartInfoForPartTable(config, obPartInfos, priKeyColumnName)
     }
   }
 
@@ -434,48 +434,70 @@ object OBMySQLPartition extends Logging {
   }
 
   private def computeUnevenlyWherePartInfoForPartTable(
-      conn: Connection,
       config: OceanBaseConfig,
       obPartInfos: Array[OBPartInfo],
       priKeyColumnName: String): Array[InputPartition] = {
     val startTime = System.nanoTime()
-    val futures = obPartInfos.map(
-      obPartInfo => {
-        Future {
-          val partitionName = obPartInfo.subPartName match {
-            case x if Objects.isNull(x) => PARTITION_QUERY_FORMAT.format(obPartInfo.partName)
-            case _ => PARTITION_QUERY_FORMAT.format(obPartInfo.subPartName)
-          }
-          val unevenlyPriKeyTableInfo =
-            obtainUnevenlyPriKeyTableInfo(conn, config, partitionName, priKeyColumnName)
-          val partitions =
-            computeUnevenlyWhereSparkPart(
-              conn,
-              unevenlyPriKeyTableInfo,
-              partitionName,
-              priKeyColumnName,
-              config)
-          partitions
-        }
-      })
-    val arr = futures.flatMap(
-      future => {
-        Await.result(future, Duration(10, TimeUnit.MINUTES))
-      })
-    val endTime = System.nanoTime()
-    logInfo(s"Time cost: ${(endTime - startTime) / 1000000} ms")
 
-    arr.zipWithIndex.map {
-      case (partInfo, index) =>
-        OBMySQLPartition(
-          partInfo.partitionClause,
-          limitOffsetClause = EMPTY_STRING,
-          whereClause = partInfo.whereClause,
-          useHiddenPKColumn = partInfo.useHiddenPKColumn,
-          unevenlyWhereValue = partInfo.unevenlyWhereValue,
-          idx = index
-        )
-    }.toArray
+    // Create custom thread pool with optimized parallelism
+    val maxParallelism = config.getJdbcPartitionComputeParallelism
+    val partitionCount = obPartInfos.length
+    val parallelism = Math.min(partitionCount, maxParallelism)
+    val executor = Executors.newFixedThreadPool(parallelism)
+    val executionContext = ExecutionContext.fromExecutor(executor)
+
+    try {
+      val futures = obPartInfos.map(
+        obPartInfo => {
+          Future {
+            val conn = OBJdbcUtils.getConnection(config)
+            try {
+              val partitionName = obPartInfo.subPartName match {
+                case x if Objects.isNull(x) => PARTITION_QUERY_FORMAT.format(obPartInfo.partName)
+                case _ => PARTITION_QUERY_FORMAT.format(obPartInfo.subPartName)
+              }
+              val unevenlyPriKeyTableInfo =
+                obtainUnevenlyPriKeyTableInfo(conn, config, partitionName, priKeyColumnName)
+              val partitions =
+                computeUnevenlyWhereSparkPart(
+                  conn,
+                  unevenlyPriKeyTableInfo,
+                  partitionName,
+                  priKeyColumnName,
+                  config)
+              partitions
+            } finally {
+              conn.close()
+            }
+          }(executionContext)
+        })
+      val arr = futures.flatMap(
+        future => {
+          Await.result(future, Duration(10, TimeUnit.MINUTES))
+        })
+      val endTime = System.nanoTime()
+      logInfo(
+        s"Partition computation completed with parallelism=$parallelism, time cost: ${(endTime - startTime) / 1000000} ms")
+
+      arr.zipWithIndex.map {
+        case (partInfo, index) =>
+          OBMySQLPartition(
+            partInfo.partitionClause,
+            limitOffsetClause = EMPTY_STRING,
+            whereClause = partInfo.whereClause,
+            useHiddenPKColumn = partInfo.useHiddenPKColumn,
+            unevenlyWhereValue = partInfo.unevenlyWhereValue,
+            idx = index
+          )
+      }.toArray
+    } finally {
+      // Shutdown thread pool
+      executor.shutdown()
+      if (!executor.awaitTermination(30, TimeUnit.SECONDS)) {
+        executor.shutdownNow()
+        logWarning("Thread pool did not terminate gracefully, forcing shutdown")
+      }
+    }
   }
 
   /**