如何自定义ForkJoinPool提升并行流ParallelStream执行速度-快上网网站建设公司

如何自定义ForkJoinPool提升并行流ParallelStream执行速度

今天就跟大家聊聊有关如何自定义ForkJoinPool提升并行流 ParallelStream执行速度，可能很多人都不太了解，为了让大家更加了解，小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。

创新互联公司专注于企业营销型网站建设、网站重做改版、南县网站定制设计、自适应品牌网站建设、H5页面制作、商城网站建设、集团公司官网建设、成都外贸网站建设公司、高端网站制作、响应式网页设计等建站业务，价格优惠性价比高，为南县等各大城市提供网站开发制作服务。

简介

在 java8 中添加了流Stream，可以让你以一种声明的方式处理数据。使用起来非常简单优雅。ParallelStream 则是一个并行执行的流，采用 ForkJoinPool 并行执行任务，提高执行速度。

下面我们看看2个简单的示例：

示例1 （list）

Arrays.asList(1,2,3,4,5,6)
	.parallelStream()
	.forEach((value) -> {
		String name = Thread.currentThread().getName();
		System.out.println("示例1 Thread:" + name + " value:" + value);
	});

示例2 （array）

Stream.of(1,2,3,4,5,6)
	.parallel()
	.forEach((value) -> {
		String name = Thread.currentThread().getName();
		System.out.println("示例2 Thread:" + name + " value:" + value);
	});

问题引出

笔者最近在做一些爬虫相关的业务，其核心工具已开源 mica-http：https://gitee.com/596392912/mica/tree/master/mica-http ，经过2个版本的迭代已经发展成了一个强大非账号爬虫利器，赶紧来试试吧。

如何自定义ForkJoinPool提升并行流 ParallelStream执行速度

我们采集了大量的代理 ip 用来供爬虫使用，其中有个定时任务每 5 分钟去检测代理是否失效，代理 ip 检测比较费时，我们给每个检测的请求设定了 2s 的超时，这样单线程的话 1000 个 ip 就得消耗半个多小时，当然笔者在校验的时候采用的 parallel Stream 简化开发。

然后发现效果并不明显，代理 ip 数量上来之后 5 分钟完全检测不完，导致任务堆积。明明用了并发流为什么没有明显的提高执行速度呢？

如何自定义ForkJoinPool提升并行流 ParallelStream执行速度

下面我们来看看刚刚的“示例”打印出的信息：

示例1 Thread:main value:4
示例1 Thread:ForkJoinPool.commonPool-worker-2 value:1
示例1 Thread:main value:6
示例1 Thread:ForkJoinPool.commonPool-worker-2 value:5
示例1 Thread:main value:3
示例1 Thread:ForkJoinPool.commonPool-worker-1 value:2
示例2 Thread:main value:4
示例2 Thread:ForkJoinPool.commonPool-worker-3 value:3
示例2 Thread:ForkJoinPool.commonPool-worker-2 value:5
示例2 Thread:ForkJoinPool.commonPool-worker-4 value:1
示例2 Thread:ForkJoinPool.commonPool-worker-5 value:2
示例2 Thread:ForkJoinPool.commonPool-worker-1 value:6

我们可以看到 Parallel Stream，默认采用的是一个 ForkJoinPool.commonPool 的线程池，这样我们就算使用了 Parallel Stream，整个 jvm 共用一个 common pool 线程池，一不小心就任务堆积了，在校验代理 ip 的时候我们还有采集代理等其他的任务中也大量使用了并发流，这样也就印证了为什么会任务堆积了。

解决问题

使用自定义 ForkJoinPool 执行速度。示例代码如下：

// 示例：自定义线程池
ForkJoinPool forkJoinPool = new ForkJoinPool(8);

// 这里是从数据库里查出来的一批代理 ip
List records = new ArrayList<>();

// 找出失效的代理 ip
List needDeleteList = forkJoinPool.submit(() -> records.parallelStream()
	.map(ProxyList::getIpPort)
	.filter(IProxyListTask::isFailed)
	.collect(Collectors.toList())
).join();

// 删除失效的代理

整个代码依然比较优雅，在使用自定义的 ForkJoin 线程池之后，执行速度有了明显的提升。以前 5 分钟执行不完的任务现在 2 分钟之内就能全部执行完毕。

结论

java8 的并发流在大批量数据处理时可简化多线程的使用，在遇到耗时业务或者重度使用并发流不妨根据业务情况采用自定义线程池来提示处理速度。

看完上述内容，你们对如何自定义ForkJoinPool提升并行流 ParallelStream执行速度有进一步的了解吗？如果还想了解更多知识或者相关内容，请关注创新互联行业资讯频道，感谢大家的支持。

分享题目：如何自定义ForkJoinPool提升并行流ParallelStream执行速度
转载来于：http://cdkjz.cn/article/jsdojg.html

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

如何自定义ForkJoinPool提升并行流ParallelStream执行速度

简介

示例1 （list）

示例2 （array）

问题引出

解决问题

结论

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

如何自定义ForkJoinPool提升并行流ParallelStream执行速度

简介

示例1 （list）

示例2 （array）

问题引出

解决问题

结论

相关资讯

怎么在Java后端实现一个Cookie-创新互联

MongoDB文档更新（一）-创新互联

MySQL的数据类型主要包括哪些-创新互联

Windows10安全新特性有哪些-创新互联

微信小程序button标签open-type属性原理解析-创新互联

SpringSecurity和Shiro的相同点与不同点有哪些-创新互联

一个网络协议的要素包括哪些-创新互联

oracle11g如何修改数据文件路径-创新互联

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接