【揭秘】ForkJoinTask全面解析-天翼云

【揭秘】ForkJoinTask全面解析

2024-04-19 06:31:17 阅读次数：46

内容摘要

ForkJoinTask的显著优点在于其高效的并行处理能力，它能够将复杂任务拆分成多个子任务，并利用多核处理器同时执行，从而显著提升计算性能，此外，ForkJoinTask还提供了简洁的API和强大的任务管理机制，使得开发者能够更轻松地编写并行化代码，高效地利用系统资源。

核心概念

ForkJoinTask在Java中主要用来解决可以并行处理的任务的分解与合并问题，它是行计算框架ForkJoinFramework的核心组件，提供了一种高效的方式来利用多核处理器，它解决了以下几个方面的问题：

任务分解：很多计算密集型或数据处理密集型的问题可以分解为更小的子任务，例如，对一个大型数组进行排序或处理大量数据记录时，通常可以将数组或数据记录集分割成多个较小的部分，然后并行处理这些部分，ForkJoinTask提供了将任务递归分解成更小任务的方式，直到任务足够小以至于顺序执行比并行执行更高效。
任务并行化：通过ForkJoinPool，ForkJoinTask能够将分解后的子任务分配给不同的线程执行，从而实现并行处理，这充分利用了多核处理器的计算能力，提高了程序的执行效率。
任务结果合并：在子任务并行执行完成后，需要将它们的结果合并以得到最终的结果，ForkJoinTask提供了合并子任务结果的机制，确保所有子任务的结果都能正确地组合在一起。
工作窃取：ForkJoinPool还实现了工作窃取算法，这意味着当一个线程完成了它自己的任务后，它可以从其他线程的任务队列中“窃取”任务来执行，从而减少了线程的空闲时间，提高了资源利用率。

因此，ForkJoinTask是用来处理可并行化任务的强大工具，它通过任务分解、并行化、结果合并和工作窃取等机制，有效地提高了程序的执行效率和资源利用率。

#代码案例

下面是一个使用了ForkJoinTask的简单示例，演示了如何分解一个任务，使其并行处理一个整数数组，并计算数组中所有元素的和。

先创建一个SumTask类，它继承自RecursiveTask<Integer>，用于计算数组元素的和，如果数组的大小超过一个阈值（例如10），则任务将递归地分解为两个子任务，分别处理数组的前半部分和后半部分，否则，任务将顺序计算数组的和，如下代码：

import java.util.concurrent.RecursiveTask;  
  
public class SumTask extends RecursiveTask<Integer> {  
    private static final int THRESHOLD = 10; // 阈值，当数组大小小于这个值时，不再进行任务分解  
    private final int[] array;  
    private final int start;  
    private final int end;  
  
    public SumTask(int[] array) {  
        this(array, 0, array.length);  
    }  
  
    private SumTask(int[] array, int start, int end) {  
        this.array = array;  
        this.start = start;  
        this.end = end;  
    }  
  
    @Override  
    protected Integer compute() {  
        // 如果任务足够小，直接计算结果  
        if (end - start <= THRESHOLD) {  
            int sum = 0;  
            for (int i = start; i < end; i++) {  
                sum += array[i];  
            }  
            return sum;  
        } else {  
            // 否则，将任务分解为两个子任务  
            int middle = (start + end) / 2;  
            SumTask leftTask = new SumTask(array, start, middle);  
            SumTask rightTask = new SumTask(array, middle, end);  
  
            // 异步执行子任务并等待结果  
            return leftTask.fork().join() + rightTask.fork().join();  
        }  
    }  
}

如下client代码（main函数），如下：

import java.util.concurrent.ForkJoinPool;  
import java.util.concurrent.ForkJoinTask;  
  
public class ForkJoinTaskExample {  
    public static void main(String[] args) {  
        int[] array = new int[100];  
  
        // 初始化数组  
        for (int i = 0; i < array.length; i++) {  
            array[i] = i;  
        }  
  
        // 创建一个ForkJoinPool  
        ForkJoinPool pool = new ForkJoinPool();  
  
        // 提交任务并获取结果  
        ForkJoinTask<Integer> task = new SumTask(array);  
        Integer sum = pool.invoke(task);  
  
        // 输出结果  
        System.out.println("Sum of array elements: " + sum);  
  
        // 关闭ForkJoinPool（虽然不是严格必需的，因为在这个简单例子中程序即将结束，但在生产代码中是个好习惯）  
        pool.shutdown();  
    }  
}

运行代码将输出，如下：

Sum of array elements: 4950

数组包含了0到99的整数，它们的和是4950，通过使用ForkJoinTask，能够并行地计算这个和。

核心API

ForkJoinTask 是 Java 并发包 java.util.concurrent 中的一个抽象类，它表示可以被 ForkJoinPool 执行的任务，ForkJoinTask 有两个直接子类：RecursiveAction 和 RecursiveTask，分别表示不返回结果和返回结果的任务，以下是 ForkJoinTask 及其子类中一些重要方法的简要说明：

fork()

该方法用于在 ForkJoinPool 中异步地执行当前任务，如果当前任务已经在执行，则该方法不会有任何效果，调用 fork() 后，任务进入 ForkJoinPool 的工作队列中等待执行，fork() 是一个非阻塞方法，它会立即返回。

join()

该方法用于等待任务的完成，并获取其结果（如果任务有结果的话），如果任务已经完成，join() 会立即返回结果，如果任务尚未完成，join() 会阻塞调用线程，直到任务完成为止，对于 RecursiveAction，join() 没有返回值；对于 RecursiveTask，join() 返回任务计算的结果。

invoke()

该方法用于在当前线程中执行任务，而不是在 ForkJoinPool 中异步执行，invoke() 会等待任务完成，并返回结果（如果任务有结果的话），通常，在不需要并行处理或任务很小不适合分解时使用 invoke()。

invokeAll(ForkJoinTask... tasks)

这是ForkJoinTask 的静态方法，该方法用于执行给定的任务数组，并等待所有任务完成，它返回一个包含每个任务结果的数组（如果任务是 RecursiveTask 类型的话），如果任务是 RecursiveAction 类型，则结果数组中的每个元素都是 null，因为 RecursiveAction 不返回结果。

getPool()

返回执行此任务的 ForkJoinPool，如果任务尚未安排或已开始，则返回 null。

getRawResult()

对于 RecursiveTask，返回任务的结果，但不等待任务完成。如果任务尚未完成，则可能返回不确定的结果，对于 RecursiveAction，此方法没有定义，因为它不返回结果。

setRawResult(V value)

对于 RecursiveTask，此方法用于设置任务的结果，这通常在任务计算完成后调用，对于 RecursiveAction，此方法没有定义。

isCompletedAbnormally()

如果任务因异常而完成，则返回 true。

isCancelled()

如果任务被取消，则返回 true。

cancel(boolean mayInterruptIfRunning)

尝试取消此任务的执行，如果任务已经开始执行，则参数 mayInterruptIfRunning 决定是否应该中断执行任务的线程。

ForkJoinTask 的设计主要是为了支持分治算法和并行计算，在实际使用中，通常通过扩展 RecursiveAction 或 RecursiveTask 来实现自己的并行任务，而不是直接使用 ForkJoinTask 类，此外，使用 ForkJoinTask 时需要注意任务的粒度控制，以避免过度分解导致的性能下降。

核心总结

【揭秘】ForkJoinTask全面解析

ForkJoinTask是Java中处理并行计算的利器，其优点在于能够轻松地将大任务拆分成小任务，利用多核处理器并行处理，提高执行效率，它的缺点也很明显，比如任务划分和数据同步的复杂性可能导致额外的开销。ForkJoinTask适合处理计算密集型且可分解的任务，但要注意任务粒度的控制，避免划分过细；同时，合理处理线程安全和任务依赖关系，确保数据的正确性和一致性。

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

【揭秘】ForkJoinTask全面解析

【揭秘】ForkJoinTask全面解析

内容摘要

核心概念

核心API

fork()

join()

invoke()

invokeAll(ForkJoinTask... tasks)

getPool()

getRawResult()

setRawResult(V value)

isCompletedAbnormally()

isCancelled()

cancel(boolean mayInterruptIfRunning)

核心总结

相关文章

恕我直言你可能真的不会java第4篇：Stream管道流Map操作

Python矩阵和Numpy数组的那些事儿

文心一言 VS 讯飞星火 VS chatgpt （61）-- 算法导论6.4 5题

给你一个正整数数组 nums，请你移除 最短 子数组（可以为 空）， 使得剩余元素的 和 能被 p 整除。 不允许 将整个数组都移除。

文心一言 VS 讯飞星火 VS chatgpt （22）-- 算法导论4.2 2题

股票问题2。给定一个数组 prices ，其中 prices[i] 是一支给定股票第 i 天的价格。设计一个算法来计算你所能获取的最大利润。

股票问题4。给定一个整数数组 prices ，它的第 i 个元素 prices[i] 是一支给定的股票在第 i 天的价格。设计一个算法来计算你所能获取的最大利润。

打砖块。有一个 m x n 的二元网格，其中 1 表示砖块，0 表示空白。

股票问题1。给定一个数组 prices ，它的第 i 个元素 prices[i] 表示一支给定股票第 i 天的价格。

找到非负数组中拥有“最大或的结果“的最短子数组，返回最短长度。

作者介绍

最新文章

js 数组是不是相等

ES6的解构赋值

分割时间方法

java知识点总结（二）

普通函数和箭头函数的区别

数组扁平化

热门文章

ArrayList动态数组对象 c# 1231

jdk1.8HashMap扩容后链表拆分过程解析

#yyds干货盘点# leetcode-dp-maxProduct

leetcode-dp-53. 最大子数组和

leetcode-53-dp

leetcode-dp-maxProduct

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

数组初始化的不同方式及其性能比较

前端学习案例-Array.from方法详解

js 数组是不是相等

给你一个 非递减 的正整数数组 nums 和整数 K， 判断该数组是否可以被分成一个或几个 长度至少 为 K 的 不相交的递增子序列。

leetcode-dp-309

Lc_209长度最小的子数组

给你一个正整数数组 nums，请你移除最短子数组（可以为空），使得剩余元素的和能被 p 整除。不允许将整个数组都移除。

给你一个非递减的正整数数组 nums 和整数 K，判断该数组是否可以被分成一个或几个长度至少为 K 的不相交的递增子序列。