ArrayList与linkedList的用法区别及扩容方式

2023-03-13 14:03:22 扩容 区别 用法

1. Array

Array(数组)是基于索引(index)的数据结构,它使用索引在数组中搜索和读取数据是很快的。

Array获取数据的时间复杂度是O(1),但是要删除数据却是开销很大,因为这需要重排数组中的所有数据, (因为删除数据以后, 需要把后面所有的数据前移)

缺点: 数组初始化必须指定初始化的长度, 否则报错

例如:

int[] a = new int[4];//推介使用int[] 这种方式初始化

int c[] = {23,43,56,78};//长度:4,索引范围:[0,3]

2. List

List—是一个有序的集合,可以包含重复的元素,提供了按索引访问的方式,它继承Collection。

List有两个重要的实现类:ArrayList和LinkedList

List是一个接口,不可以实例化, 不能写成如下:

List<Integer> list = new List<Integer>();//错误

类继承关系

3. ArrayList

  • ArrayList: 可以看作是能够自动增长容量的数组
  • ArrayList的toArray方法返回一个数组
  • ArrayList的asList方法返回一个列表

ArrayList底层的实现是Array, 数组扩容实现

  • 新增数据空间判断
  • 新增数据的时候需要判断当前是否有空闲空间存储
  • 扩容需要申请新的连续空间
  • 把老的数组复制过去
  • 新加的内容
  • 回收老的数组空间

4. 使用数组长度分配空间性能对比

注意: 长度尽量使用2的幂作为长度, 计算机分配空间大都使用次幂去分配, 减少碎片空间

我们下来看一下代码:

package javatest;
 
import java.util.ArrayList;
import java.util.List;
 

public class Jtest {
 
    public static int length = 1048576; //10的20次幂
    public static List<Integer> list1 = new ArrayList<>();
    public static List<Integer> list2 = new ArrayList<>(length);
 
    public static void addList(int sign) {
        long start = System.currentTimeMillis();
        for (int i = 0; i < length; i++) {
            if (sign == 0) {
                list1.add(sign);
            } else {
                list2.add(sign);
            }
        }
        long end = System.currentTimeMillis();
        System.out.println(sign + " exec time is: " + (end - start));
    }
 
    public static void main(String[] args) {
        addList(0);
        addList(1);
    }
}

执行结果:

0 exec time is: 25
1 exec time is: 17

ArrayList在初始化的时候指定长度肯定是要比不指定长度的性能好很多, 这样不用重复的申请空间, 复制数组, 销毁老的分配空间了

5. LinkList

LinkList是一个双链表,在添加和删除元素时具有比ArrayList更好的性能.

但在get与set方面弱于ArrayList.当然,这些对比都是指数据量很大或者操作很频繁。

链表不需要连续的空间, 大小不确定

6. 对比

时间复杂度

操作数组链表
随机访问O(1)O(N)
头部插入O(N)O(1)
头部删除O(N)O(1)
尾部插入O(1)O(1)
尾部删除O(1)O(1)

小结

  • 同样查找, 时间复杂度都是O(N), 但是数组要比链表快
  • 因为数组的连续内存, 会有一部分或者全部数据一起进入到CPU缓存, 而链表还需要在去内存中根据上下游标查找, CPU缓存比内存块太多
  • 数据大小固定, 不适合动态存储, 动态添加, 内存为一连续的地址, 可随机访问, 查询速度快
  • 链表代销可变, 扩展性强, 只能顺着指针的方向查询, 速度较慢

7. ArrayList的源码分析

7.1 ArrayList的主要成员变量

  private static final int DEFAULT_CAPACITY = 10;
  // ArrayList的默认长度是多少
    private static final Object[] EMPTY_ELEMENTDATA = {};
  // ArrayList的默认空元素链表
    private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
  // ArrayList存放的数据
    transient Object[] elementData; // non-private to simplify nested class access
  // ArrayList的长度
    private int size;

7.2 ArrayList的构造函数

// 构造一个初始化容量为10的空列表
public ArrayList() {
        this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
    }
// 初始化一个指定大小容量的列表
public ArrayList(int initialCapacity) {
        if (initialCapacity > 0) {
            this.elementData = new Object[initialCapacity];
        } else if (initialCapacity == 0) {
            this.elementData = EMPTY_ELEMENTDATA;
        } else {
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        }
    }
// 构造一个包含指定集合的元素列表, 按照它们由集合迭代器返回的顺序
public ArrayList(Collection<? extends E> c) {
        elementData = c.toArray();
        if ((size = elementData.length) != 0) {
            // c.toArray might (incorrectly) not return Object[] (see 6260652)
            if (elementData.getClass() != Object[].class)
                elementData = Arrays.copyOf(elementData, size, Object[].class);
        } else {
            // replace with empty array.
            this.elementData = EMPTY_ELEMENTDATA;
        }
    }

7.3 扩容机制

ArrayList扩容的核心从ensureCapacityInternal方法说起。可以看到前面介绍成员变量的提到的ArrayList有两个默认的空数组:

  • DEFAULTCAPACITY_EMPTY_ELEMENTDATA:是用来使用默认构造方法时候返回的空数组。如果第一次添加数据的话那么数组扩容长度为DEFAULT_CAPACITY=10
  • EMPTY_ELEMENTDATA:出现在需要用到空数组的地方,其中一处就是使用自定义初始容量构造方法时候如果你指定初始容量为0的时候就会返回。
// 增加元素的方法
public boolean add(E e) {
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        elementData[size++] = e;
        return true;
    }
 
 //判断当前数组是否是默认构造方法生成的空数组,如果是的话minCapacity=10反之则根据原来的值传入下一个方法去完成下一步的扩容判断
private static int calculateCapacity(Object[] elementData, int minCapacity) {
        if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
            return Math.max(DEFAULT_CAPACITY, minCapacity);
        }
        return minCapacity;
        }
 
//minCapacitt表示修改后的数组容量,minCapacity = size + 1
 private void ensureCapacityInternal(int minCapacity) {
        //判断看看是否需要扩容
        ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
    }

下面谈谈ensureExplicitCapacity方法(modCount设计到Java的快速报错机制后面会谈到),可以看到如果修改后的数组容量大于当前的数组长度那么就需要调用grow进行扩容,反之则不需要。

//判断当前ArrayList是否需要进行扩容
private void ensureExplicitCapacity(int minCapacity) {
  modCount++;
 
  // overflow-conscious code
  // int[] a = new int[5]; 数组创建的时候是多大, a.length就等于5
  if (minCapacity - elementData.length > 0)
    grow(minCapacity);
}

最后看下ArrayList扩容的核心方法grow(),下面将针对三种情况对该方法进行解析:

  • 当前数组是由默认构造方法生成的空数组并且第一次添加数据。此时minCapacity等于默认的容量(10)那么根据下面逻辑可以看到最后数组的容量会从0扩容成10。而后的数组扩容才是按照当前容量的1.5倍进行扩容;
  • 当前数组是由自定义初始容量构造方法创建并且指定初始容量为0。此时minCapacity等于1那么根据下面逻辑可以看到最后数组的容量会从0变成1。这边可以看到一个严重的问题,一旦我们执行了初始容量为0,那么根据下面的算法前四次扩容每次都 +1,在第5次添加数据进行扩容的时候才是按照当前容量的1.5倍进行扩容。
  • 当扩容量(newCapacity)大于ArrayList数组定义的最大值后会调用hugeCapacity来进行判断。如果minCapacity已经大于Integer的最大值(溢出为负数)那么抛出OutOfMemoryError(内存溢出)否则的话根据与MAX_ARRAY_SIZE的比较情况确定是返回Integer最大值还是MAX_ARRAY_SIZE。这边也可以看到ArrayList允许的最大容量就是Integer的最大值(-2的31次方~2的31次方减1)
private void grow(int minCapacity) {
        // overflow-conscious code
        int oldCapacity = elementData.length;
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        // minCapacity is usually close to size, so this is a win:
        elementData = Arrays.copyOf(elementData, newCapacity);
    }

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持。

相关文章