博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
[改善Java代码]不同的列表选择不同的遍历方法
阅读量:6600 次
发布时间:2019-06-24

本文共 5872 字,大约阅读时间需要 19 分钟。

一.场景:

我们来看一个场景,统计一个省的各科高考科目考试的平均分.

当然使用数据库中的一个SQL语句就能求出平均值,不过这个不再我们的考虑之列,这里只考虑使用纯Java的方式来解决.(由于我的机器配置比较好,用80万的数据量有点小,各个统计结果不明显,不能更加显著的说明明问题...这里改为800万)

看代码:

1 import java.util.ArrayList; 2 import java.util.Iterator; 3 import java.util.List; 4 import java.util.Random; 5  6 public class Client { 7     public static void main(String[] args) { 8         //学生数量,800万 9         int stuNum = 800*10000;10         //List集合,记录所有学生的分数11         List
scores = new ArrayList
(stuNum);12 //写入分数13 for(int i=0;i
list){24 int sum = 0;25 //遍历求和26 for(int i:list){27 sum +=i;28 }29 /*30 Java中的foreach()语法是iterator(迭代器)的变形用法,上面的foreach语法和下面的代码等价31 for(Iterator
i=list.iterator(); i.hasNext(); ){32 sum +=i.next();33 } 34 */35 36 //除以人数,计算平均值37 return sum/list.size();38 }39 }

运行结果:

平均分是:74执行时间:99ms

仅仅求一个平均值就花费了74毫秒,考虑其他诸如加权平均值、补充平均值等的话,花费时间肯定更长。我们仔细分析一下arverage方法,加号操作是最基本操作,没有可以优化,我们可以尝试对List遍历进行优化。 

List的遍历还有另外一种形式,即通过下表方式来遍历,如下

1 import java.util.ArrayList; 2 import java.util.Iterator; 3 import java.util.List; 4 import java.util.Random; 5  6 public class Client { 7     public static void main(String[] args) { 8         //学生数量,800万 9         int stuNum = 800*10000;10         //List集合,记录所有学生的分数11         List
scores = new ArrayList
(stuNum);12 //写入分数13 for(int i=0;i
list){ 24 int sum = 0; 25 //遍历求和 26 for(int i = 0, size = list.size(); i < size; i++){ 27 sum += list.get(i); 28 } 29 //除以人数,计算平均值 30 return sum/list.size(); 31 } 32 }

 

运行结果如下: 

平均分是:74执行时间:58ms

执行时间大幅提升,性能提升65%。 

为什么会有如此提升呢?我们知道foreacher与下面代码等价 

for(Iterator
i = list.iterator(); i.hasNext;){ sum += i.next(); }

迭代器是23中设计模式的一种,提供一种方法访问一个容器对象中的各个元素,同时又无须暴露该对象的内部细节。也就是说对于ArrayList,需要先创建一个迭代器容器,然后屏蔽内部遍历细节,对外提供hasNext、next等方法。 

问题是ArrayList实现了RandomAccess接口,表明元素之间本没有关系,为了使用迭代器就需要强制建立一种互相“知晓”的关系,比如上一个元素可以判断是否有下一个元素,以及下一个元素是什么等关系,这也就是通过foreach遍历耗时的原因。 

 

Java为ArrayList类加上了RandomAccess接口,就是在告诉我们"ArrayList是随机存取的,采用下标方式遍历列表速度会更快".

但是为什么不把RadomAccess加到所有的List实现类上呢?

那是因为有些List实现类是不能随机存取的,而是有序存取的,比如LinkedList类,LinkedList也是一个列表,但是它实现了双向链表,每个数据节点中都有三个数据项:前节点的引用(Previous Node),本节点元素(Node Element),后继节点的引用(Next Node),这是数据结构的节本知识,也就是在LinkedList中的两个元素本来就是有关联的,我知道你的存在,你也知道我的存在.

综上对于LinkedList由分析讲述,元素之间已经有关联了,使用foreach也就是迭代器方式是不是更高呢?代码如下

1 import java.util.LinkedList; 2 import java.util.List; 3 import java.util.Random; 4  5 public class Client { 6     public static void main(String[] args){    7         //学生数量,80万    8         int stuNum = 800 * 10000;    9         //List集合,记录所有学生分数   10         List
scores = new LinkedList
(); 11 12 //写入分数 13 for(int i = 0; i < stuNum; i++){ 14 scores.add(new Random().nextInt(150));15 } 16 17 //记录开始计算时间 18 long start = System.currentTimeMillis(); 19 System.out.println("平均分是:" + average(scores)); 20 System.out.println("执行时间:" + (System.currentTimeMillis() - start) + "ms"); 21 } 22 public static int average(List
list){ 23 int sum = 0; 24 //foreach遍历求和 25 for(int i : list){ 26 sum += i; 27 } 28 //除以人数,计算平均值 29 return sum/list.size(); 30 } 31 }

运行结果:

平均分是:74执行时间:118ms

 

可能这个数据量不是很适合.....用八十万量的数据量LinkedList使用foreach的速度和ArrayList使用普通for循环的速度差不多.....

可以测试使用下标的方式遍历LinkedList中的元素:

 

其实不用测试,效率真的非常低,直接看源代码:

1 public E get(int index){   2     return entry(index).element;   3 }

 

由entry方法查找指定下标的节点,然后返回其包含的元素,看entry方法

1 private Entry
entry(int index){ 2 //检查下标是否越界 3 Entry
e = header; 4 if(index < (size >> 1)){ 5 //如果下标小于中间值,则从头节点开始搜索 6 for(int i = 0; i <= index; I++){ 7 e = e.next; 8 } 9 }else{ 10 //如果下标大于等于中间值,则从尾节点反向遍历 11 for(int i = size; i > index; i++){ 12 e = e.previous; 13 } 14 } 15 return e; 16 }

 

程序会先判断输入的下标与中间值(size右移一位,也就是除以2了)的关系,小于中间值则从头开始正向搜索,大于中间值则从尾节点反向搜索,想想看,每一次的get方法都是一个遍历,"性能"两字从何说起呢!

明白了随机存取列表和有序存取列表的区别,average方法就必须重构,以便实现不同的列表采用不同的遍历方式.代码如下:

1 import java.util.LinkedList; 2 import java.util.List; 3 import java.util.Random; 4 import java.util.RandomAccess; 5  6 public class Client { 7     public static void main(String[] args) { 8         // 学生数量,80万 9         int stuNum = 80 * 10000;10         // List集合,记录所有学生的分数11         List
scores = new LinkedList
();12 // 写入分数13 for (int i = 0; i < stuNum; i++) {14 scores.add(new Random().nextInt(150));15 }16 17 // 记录开始计算时间18 long start = System.currentTimeMillis();19 System.out.println("平均分是:" + average(scores));20 System.out.println("执行时间:" + (System.currentTimeMillis() - start)21 + "ms");22 }23 24 // 计算平均数25 public static int average(List
list) {26 int sum = 0; 27 if (list instanceof RandomAccess) {28 //可以随机存取,则使用下标遍历29 for (int i = 0, size = list.size(); i < size; i++) {30 sum += list.get(i);31 }32 } else {33 //有序存取,使用foreach方式34 for (int i : list) {35 sum += i;36 }37 }38 // 除以人数,计算平均值39 return sum / list.size();40 }41 }

 

这样无论是随机存取列表还是有序列表,程序都可以提供快速的遍历.

列表遍历也不是那么简单的,适时选择最优的遍历方式,不要固化为一种.

 

转载于:https://www.cnblogs.com/DreamDrive/p/5647953.html

你可能感兴趣的文章
react 学习记录(四)
查看>>
httpd基本配置
查看>>
PHP判断两个多维数组是否相等
查看>>
索引失效的几个原因
查看>>
关于多线程中使用while做循环而不使用if的解释
查看>>
欢迎你,企业基础架构CCIE,RS CCIEv5.0的升级版新时代迎合自动化运维的网工顶级认证...
查看>>
乾颐堂许同学通过HCIE面试指南
查看>>
Javascript面向对象编程
查看>>
虚拟底层-xenserver、esxi,创建超大虚拟磁盘
查看>>
js typoeof用法
查看>>
函数的参数
查看>>
CentOS 7安装图界面后,重启,进不了系统
查看>>
操作无法完成.键入的打印机名不正确,或者指定的打印机没有连接到服务器上.有关详细信息,请单帮助...
查看>>
Django课堂(1)
查看>>
从携程事件给我们警示(转)
查看>>
HttpURLConnection Cannot write output after reading input.
查看>>
MSSQL 注入鄙见
查看>>
PostgreSQL学习手册(九) 服务器配置
查看>>
zabbix详解:(五)添加微信告警配置
查看>>
asp.net一般处理程序处理session未将对象设置到实例
查看>>