THIS IS B3c0me

记录生活中的点点滴滴

0%

Java集合

img

前言

参考文章:

1.https://blog.csdn.net/qq_55133453/article/details/124476889

2.https://blog.csdn.net/zdl66/article/details/126251818

3.https://blog.csdn.net/weixin_64314142/article/details/130490393

感谢原创作者

一、Java集合框架概述

​ 面向对象语言对事物的体现都是以对象的形式,为了方便对多个对象的操作,就要对对象进行存储。使用Array存储对象方面具有一些弊端,而Java集合就像一种容器,可以动态地把多个对象的引用放入容器中。

1.1 数组Array存储

(1)数组在内存存储方面的特点

  • 数组初始化以后,长度就确定了。

  • 数组声明的类型,就决定了进行元素初始化的类型。

(2)数组在存储数据方面的弊端

  • 数组初始化以后,长度就不可变了,不便于拓展。

  • 数组中提供的属性和方法少,不便于进行添加、删除、插入等操作,且效率不高。同时无法直接获取存储元素的个数

  • 数组存储的数据是有序的、可以重复的。—->存储数据的特点单一。

1.2 Java集合类存储

​ Java集合类可以用于存储数量不等的多个对象,还可以用于保存具有映射关系的关联数组。

1.3 Java集合体系

  • Collection接口

    单列数据,定义了存取一组对象的方法的集合

​ ①List:元素有序、可重复的集合

​ ②Set:元素无序、不可重复的集合

(2)Map接口
双列数据,保存具有映射关系“key-value对”的集合。

1.4 Collection继承树

  • List特点:此处顺序并不是大小顺序,而是存入数据的先后顺序。有序因为List集合都有下标,下标从0开始,以递增。
  • Set特点:取出顺序不一定为存入顺序,另外Set集合没有下标。
  • ArrayList是非线程安全的。
  • HashSet集合在new的时候,底层实际上new了一个HashMap集合。向HashSet集合中存储元素,实际上是存储到了HashMap的key中了。HashMap集合是一个Hash表数据结构。
  • TreeSet集合底层实际上是TreeMap。TreeSet集合在new的时候,底层实际上new了一个TreeMap集合。向TreeSet集合中存储元素,实际上是存储到了TreeMap的key中了。TreeMap集合是一个二叉树数据结构。

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    |----Collection接口:单列集合,用来存储一个一个的对象
    |----List接口:一种包含有序元素的线性表,可存储有序的、可重复的数据。
    可以存放多个null值。 -->“动态”数组
    |----ArrayList:作为List接口的主要实现类,多用于频繁的改查操作,线程不安全的,效率高;
    底层采用Object[] elementData数组存储。
    |----LinkedList:对于频繁的插入删除操作,使用此类效率比ArrayList效率高,线程也不安全
    底层采用双向链表存储
    |----Vector:作为List的古老实现类,线程安全的,效率低;
    底层采用Object[]数组存储

    |----Set接口:存储无序的、不可重复的数据 -->数学概念上的“集合”
    |----HashSet:作为Set接口主要实现类;线程不安全;可以存null值
    底层采用数组+链表+红黑树
    |----LinkedHashSet:作为HashSet的子类;遍历其内部数据时,可以按照添加顺序遍历;对于频繁的遍历操作,LinkedHashSet效率高于HashSet.
    底层采用数组+双向链表+红黑树
    |----TreeSet:可以按照添加对象的指定属性,进行排序。
    底层采用红黑树

1.5 Map接口继承树

1
2
3
4
5
6
7
|----Map:双列数据,存储key-value对的数据
|----HashMap:作为Map的主要实现类;线程不安全的,效率高;可存储key和value可以为null,且值(value)可以存在多个null,键(key)只能出现一个null,若key中出现多个null,其结果是对第一个null的值进行覆盖
|----LinkedHashMap:保证在遍历map元素时,可以照添加的顺序实现遍历。
原因:在原的HashMap底层结构基础上,添加了一对指针,指向前一个和后一个元素。对于频繁的遍历操作,此类执行效率高于HashMap
|----TreeMap:保证照添加的key-value对进行排序,实现排序遍历。此时考虑key的自然排序或定制排序,底层使用红黑树
|----Hashtable:作为古老的实现类;线程安全的,效率低;不能存储nullkey和value
|----Properties:常用来处理配置文件。key和value都是String类型

二、Collection接口

2.1 collection接口简介

(1)Collection 接口是List、Set和Queue接口的父接口,该接口里定义的方法既可用于操作Set集合,也可用于操作List和Queue集合。

(2)JDK不提供此接口的任何直接实现,而是提供更具体的子接口(如:Set和List实现)。

(3)在Java5之前,Java集合会丢失容器中所有对象的数据类型,把所有对象都当成Object类型处理;从JDK5.0增加了泛型之后,Java集合可以记住容器中对象的数据类型。

2.2 collection接口常用方法

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
1、添加
add(Object obj)
addAll(Collection coll)
2、获取有效元素个数
int size()
3、清空集合
void clear()
4、判断是否为空集合
boolean isEmpty()
5、是否包含某个元素
boolean contains(Object obj):是通过元素的equals方法来判断是否是同一个对象
boolean containsAll(Collection c):也是调用元素的equals方法来比较的。用两个两个集合的元素逐一比较
6、删除
boolean remove(Object obj):通过元素的equals方法判断是否是要删除的那个元素。只会删除找到的第一个元素
boolean removeAll(Collection coll):取当前集合的差集
取两个集合的交集
boolean retainAll(Collection c):把交集的结果存在当前的集合中,不影响c
7、集合是否相等
boolean equals(Object obj)
8、转换成对象数组
Object [] toArray()
9、获取集合对象的哈希值
hashCode()
10、遍历
iterator():返回迭代器对象,用于集合遍历

三、Iterator迭代器接口

3.1 使用Iterator接口遍历集合元素

(1)Iterator对象称为迭代器(设计模式的一种),主要用于遍历Collection集合中的元素。

(2)GOF给迭代器模式的定义为:提供一种方法访问一个容器(container)对象中各个元素,而又不需暴露该对象的内部细节。迭代器模式,就是为容器而生。类似于“公交车上的售票员”、“空姐”、“火车上的乘务员”。

(3)Collection 接口继承了java.lang.Iterable接口,该接口有一个iterator()方法,那么所有实现了Collection接口的集合类都有一个iterator()方法,用以返回一个实现了Iterator接口的对象。

(4)Iterator仅用于遍历集合,Iterator本身并不提供承装对象的能力。如果需要创建Iterator对象,则必须有一个被迭代的集合。

(5)集合对象每次调用iterator()方法都能得到一个全新的迭代器对象,默认游标都在集合的第一个元素之前。

3.2 Iterator接口的方法

(1)boolean hasNext():判断是否还有下一个元素。

(2)E next():操作:指针下移,将下移以后集合位置上的元素返回

(3)void remove():删除元素。

注意:

①:在调用it.next()方法之前必须要调用it.hasNext()进行检测。若不调用,且下一条记录无效,直接调用it.next()会抛出NoSuchElementException异常.

②:Iterator可以删除集合的元素,但是是遍历过程中通过迭代器对象的remove方法,不是集合对象的remove方法。

③:如果还未调用next()或在上一次调用naxt方法之后已经调用了remove方法,再调用remove 都会报IllegalStateException。

3.3 使用foreach循环遍历集合元素

(1)Java5.0提供了foreach循环迭代访问Collection和数组。

(2)遍历操作不需获取Collection或数组的长度,无需使用索引访问元素。

(3)遍历集合的底层调用Iterator完成操作。

(4)foreach还可以用来遍历数组。

四、Collection子接口-List接口

4.1 List接口概述

(1)鉴于Java中数组用来存储数据的局限性,我们通常使用List替代数组

(2)List集合类中元素有序、且可重复,集合中的每个元素都有其对应的顺序索引。

(3)List容器中的元素都对应一个整数型的序号记载其在容器中的位置,可以根据序号存取容器中的元素。

(4)JDK API中List接口的实现类常用的有:ArrayList、LinkedList和Vector。

4.2 List接口方法

List除了从Collection集合继承的方法外,List集合里添加了一些根据索引来操作集合元素的方法。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
1void add(int index,Object ele):在index位置插入ele元素。

2boolean addAll(int index,Collection eles):从index位置开始将eles中的所有元素添加进来。

3Object get(int index):获取指定index位置的元素。

4int indexOf(Object obj):返回obj在集合中首次出现的位置。

5int lastIndexOf(Object obj):返回obj在集合中末次出现的位置。

6Object remove(int index):移除指定Index位置的元素,并返回此元素。

7Object set(int index,Object ele):设置指定index位置的元素为ele。

8)List subList(int fromIndex,int toIndex):返回从fromIndex到toIndex位置的子集合。

4.3 List实现类之一:ArrayList

(1)ArrayList 是List接口的典型实现类、主要实现类。

(2)本质上,ArrayList是对象引用的一个“变长”数组。

(3)ArrayList的JDK1.8之前与之后的实现区别?

    JDK1.7:ArrayList像饿汉式,直接创建一个初始容量为10的数组

    JDK1.8:ArrayList像懒汉式,一开始创建一个长度为0的数组,当添加第一个元素时在创建一个始容量为10的数组。

(4)Arrays.List(…)方法返回的List集合,既不是ArrayList实例,也不是Vector实例。ArrayList(…)返回值是一个固定长度的List集合。

4.4 List实现类之二:LinkedList

(1)对于频繁的插入或删除元素的操作,建议使用LinkedList类,效率较高。

(2)新增方法:

    void addFirst(Object obj)

    void addLast(Object obj)

    Object getFirst()

    Object getLast()

    Object removeFirst()

    Object removeLast()

(3)LinkedList:双向链表,内部没有声明数组,而是定义了Node类型的first和last,用于记录首末元素。同时,定义内部类Node,作为LinkedList中保存数据的基本结构。Node除了保存数据,还定义了两个变量:

  • prev变量记录前一个元素的位置
  • next变量记录下一个元素的位置

5.5 List实现类之三:Vector

(1)Vector是一个古老的集合,JDK1.0就有了。大多数操作与ArrayList相同,区别之处在于Vector是线程安全的。

(2)在各种list中,最好把ArrayList作为缺省选择。当插入、删除频繁时,使用LinkedList。Vector总是比ArrayList慢,所以尽量避免使用。

(3)新增方法:

    void addElement(Object obj)

    void insertElement(Object obj,int index)

    void set ElementAt(Object obj,int index)

    void removeElement(Object obj)

    void removeAllElements()

5.6 相应面试题

(1)ArrayList、LinkedList的异同:二者都线程不安全,相对线程安全的Vector,执行效率高。此外,ArrayList是实现了基于动态数组的数据结构,LinkedList基于链表的数据结构。对于随机访问get和set,ArrayList优先于LinkedList,因为LinkedList要移动指针。对于新增和删除操作add(特指插入)和remove,LinkedList比较占优势,因为ArrayList要移动数据。

(2)ArrayList和Vector的区别:ArrayList和Vector几乎是完全相同的,唯一的区别是在于Vector是同步类(synchronized),属于强同步类。因此开销就比ArrayList要大,访问要慢。正常情况下,大多数的程序员使用ArrayList而不是Vector,因为同步完全可以由程序员自己来控制。Vector每次扩容请求其大小的两倍空间,而ArrayList是1.5倍。Vector还有一个子类Stack。

五 、Collection子接口-Set接口

5.1 Set接口概述

(1)Set接口是Collection的子接口,set接口没有提供额外的方法

(2)Set集合不允许包含相同的元素 ,如果试把两个相同的元素加入同一个Set集合中,则添加操作失败。

(3)Set判断两个对象是否相同不是使用==运算符,而是根据equals()方法

5.2 Set实现类之一:HashSet

(1)HashSet概述
①HashSet是Set接口的典型实现,大多数时候使用Set集合时都是用这个实现类。

    ②HashSet按Hash算法来存储集合中的元素,因此具有很好的存取、查找、删除性能。

    ③HashSet具有的特点:

            >不能保证元素的排列顺序

            >HashSet不是线程安全的

            >集合元素可以是null

    ④HashSet集合判断两个元素相等的标准:两个对象通过hashCode()方法比较相等,并且两个对象的equals()方法返回值也相同

    ⑤对于存放在Set容器中的对象,对应的类一定要重写equals()和hashCode(Object obj)方法,以实现对象相等原则。即:“相等的对象必须具有相等的散列码”。

(2)向HashSet中添加元素的过程
①当向HashSet集合中存入一个元素时,HashSet会调用该对象的hashCode()方法来得到该对象的hashCode值,然后根据hashCode值,通过某种散列函数决定该对象在HashSet底层数组中的存储位置。(这个散列函数会与底层数组的长度相计算得到在数组中的下标,并且这种散列函数计算还尽可能保证能均匀存储元素,越是散列分布,该散列函数设计的越好)

    ②如果两个元素的hashCode()值相等,会在调用equals方法,如果equals方法结果为true,添加失败;如果为false,那么会保存该元素,但是该数组的位置已经有元素了,那么会通过链表的方式继续连接。

    ③如果两个元素的equals()方法返回为true,但他们的hashCode()返回值不相等,hashSet将会把它们存储在不同的位置,但依然可以添加成功。

(3)重写hashCode()方法的基本原则
①在程序运行时,同一个对象多次调用hashCode()方法应该返回相同的值。

    ②当两个对象的equals()方法比较返回为true时,这两个对象的hashCode()方法的返回值也应相等。

​ ③对象中用作equals()方法比较的Field,都应该用来计算hashCode值。

(4)重写equals()方法的基本准则
①当一个类有自己特有的“逻辑相等”概念,当改写equals()的时候,总是要改写hashCode(),根据一个类的equals()方法(改写之后),两个截然不同的实例有可能是在逻辑上是相等的,但是,根据Object.hashCode()方法,它们仅仅是两个对象。

    ②因此违反了“相等的对象必须具有相等的散列码”。
   
      ③结论:复写equals方法的时候一般需要同时复写hashCode方法。通常参与计算hashCode的对象的属性也应该参与到equals()中进行计算

5.3 Set实现类之二:LinkedHashSet

(1)LinkedHashSet是HashSet的子类

(2)LinkedHashSet根据元素的hashCode来决定元素的存储位置,但它同时使用双向链表维护元素的次序,这使得元素看起来是以插入顺序保存的。

(3)LinkedHashSet插入性能略低于HashSet,但在迭代访问Set里的全部元素时有很好的性能。

(4)LinkedHashSet不允许集合元素重复

5.4 Set实现类之三:TreeSet

(1)Tree概述
①Tree是SortedSet接口的实现类,TreeSet可以确保集合元素除余排序状态。

    ②Tree底层使用红黑树结构存储数据。

    ③新增的方法:(了解)

            >Comparator comparator()                   >Object higher(Object e)

            >Object first()                             >SortedSet subSet(fromElement,toElement)

            >Object last()                             >SortedSet headSet(toElement)

            >Object lower(Object e)             >SortedSet taiSet(fromElement)

    ④Tree两种排序方法:自然排序和定制排序。默认情况下,Tree采用自然排序。

    ⑤TreeSet和后面的TreeMap采用红黑树的存储结构。特点:有序,查询速度比List快。

(2)排序–自然排序
①自然排序:Tree会调用集合元素的compareTo(Object obj)方法来比较元素之间的大小关系,然后将集合元素按升序(默认情况)排列

    ②如果试图把一个对象添加到TreeSet时,则该对象的类必须实现Comparable接口

            >实现Comparable的类必须实现compareTo(Object obj)方法,两个对象即通过        compareTo(Object obj)方法的返回值来比较大小。

    ③Comparable的典型实现:

            >BigDecimal、BigInteger以及所有的数值型对应的包装类:按它们对应的数值大小进行  比较。

            >Character:按字符的unicode值来进行比较。

            >Boolean:true对应的包装类实例大于false对应的包装类实例。

            >String: 按字符中字符的unicode值进行比较。

            >Date、Time:后边的时间、日期比前面的时间、日期大向

    ④向 TreeSet 中添加元素时,只有第一个元素无须比较compareTo()方法,后面添 加的所有元素都会调用compareTo()方法进行比较。

    ⑤因为只有相同类的两个实例才会比较大小,所以向 TreeSet 中添加的应该是同 一个类的对象。

    ⑥对于 TreeSet 集合而言,它判断两个对象是否相等的唯一标准是:两个对象通 过 compareTo(Object obj) 方法比较返回值。

    ⑦当需要把一个对象放入 TreeSet 中,重写该对象对应的 equals() 方法时,应保 证该方法与 compareTo(Object obj) 方法有一致的结果:如果两个对象通过 equals() 方法比较返回 true,则通过 compareTo(Object obj) 方法比较应返回 0。 否则,让人难以理解。

(3)排序–定制排序
①TreeSet的自然排序要求元素所属的类实现Comparable接口,如果元素所属的类没 有实现Comparable接口,或不希望按照升序(默认情况)的方式排列元素或希望按照 其它属性大小进行排序,则考虑使用定制排序。定制排序,通过Comparator接口来 实现。需要重写compare(T o1,T o2)方法。

    ②利用int compare(T o1,T o2)方法,比较o1和o2的大小:如果方法返回正整数,则表 示o1大于o2;如果返回0,表示相等;返回负整数,表示o1小于o2。

    ③要实现定制排序,需要将实现Comparator接口的实例作为形参传递给TreeSet的构造器。

    ④此时,仍然只能向TreeSet中添加类型相同的对象。否则发生ClassCastException异常

    ⑤使用定制排序判断两个元素相等的标准是:通过Comparator比较两个元素返回了0。

六、Map接口

6.1 Map接口概述

​ ① Map与Collection并列存在。用于保存具有映射关系的数据:key-value ,Map 中的 key 和 value 都可以是任何引用类型的数据

​ ② Map 中的 key 用Set来存放,不允许重复,即同一个 Map 对象所对应的类,须重写hashCode()和equals()方法

​ ③ 常用String类作为Map的“键” ,key 和 value 之间存在单向一对一关系,即通过指定的 key 总能找到 唯一的、确定的 value

​ ④ Map接口的常用实现类:HashMap、TreeMap、LinkedHashMap和 Properties。其中,HashMap是 Map 接口使用频率最高的实现类

6.2 Map接口常用方法

​ ① 添加、删除、修改操作:

1
2
3
4
5
6
7
> Object put(Object key,Object value):将指定key-value添加到(或修改)当前map对象中

> void putAll(Map m):将m中的所有key-value对存放到当前map

> Object remove(Object key):移除指定keykey-value对,并返回value

> void clear():清空当前map中的所有数据

​ ② 元素查询的操作:

1
2
3
4
5
6
7
8
9
> Object get(Object key):获取指定key对应的value

> boolean containsKey(Object key):是否包含指定的key

> boolean containsValue(Object value):是否包含指定的value

> int size():返回mapkey-value对的个数

> boolean isEmpty():判断当前map是否为空  boolean equals(Object obj):判断当前map和参数对象obj是否相等

​ ③ 元视图操作的方法:

1
2
3
4
5
> Set keySet():返回所有key构成的Set集合

> Collection values():返回所有value构成的Collection集合

> Set entrySet():返回所有key-value对构成的Set集合

6.3 Map实现类之一:HashMap

(1)HashMap概述
①HashMap是Map接口使用频率最高的实现类。

​ ②允许使用null键和null值,与HashSet一样,不保证映射的顺序。

​ ③所有的key构成的集合是Set:无序的、不可重复的。所以,key所在的类要重写equals()和hashCode()

​ ④所有的value构成的集合是Collection:无序的、可以重复的。所以,value所在的类要重写equals()

​ ⑤一个key-value构成一个entry

​ ⑥所有的entry构成的集合是Set:无序的、不可重复的

​ ⑦HashMap 判断两个key相等的标准是:两个key通过equals()方法返回true,hashCode值也相等。

​ ⑧HashMap 判断两个value相等的标准是:两个value通过equals()方法返回true。

6.4 Map实现类之二:LinkedHashMap

(1) LinkedHashMap概述
①LinkedHashMap是HashMap的子类

​ ②在HashMap存储结构的基础上,使用了一堆双向链表来记录添加元素的顺序

    ③与LinkedHashSet类似,LinkedHashMap可以维护Map的迭代顺序:迭代顺序与Key-Value对的插入顺序一致 

6.5 Map实现类之三:TreeMap

(1)TreeMap存储 Key-Value 对时,需要根据 key-value 对进行排序。 TreeMap 可以保证所有的 Key-Value 对处于有序状态。

(2)TreeSet底层使用红黑树结构存储数据

(3)TreeMap 的 Key 的排序:

    >自然排序:TreeMap 的所有的 Key 必须实现 Comparable 接口,而且所有 的 Key 应该是同一个类的对象,否则将会抛出 ClasssCastException

    >定制排序:创建 TreeMap 时,传入一个 Comparator 对象,该对象负责对 TreeMap 中的所有 key 进行排序。此时不需要 Map 的 Key 实现 Comparable 接口

(4) TreeMap判断两个key相等的标准:两个key通过compareTo()方法或 者compare()方法返回0。

6.6 Map实现类之四:Hashtable

(1)Hashtable是个古老的 Map 实现类,JDK1.0就提供了。不同于HashMap, Hashtable是线程安全的。

(2) Hashtable实现原理和HashMap相同,功能相同。底层都使用哈希表结构,查询 速度快,很多情况下可以互用。

(3) 与HashMap不同,Hashtable 不允许使用 null 作为 key 和 value

(4)与HashMap一样,Hashtable 也不能保证其中 Key-Value 对的顺序

(5)Hashtable判断两个key相等、两个value相等的标准,与HashMap一致。

6.7 Map实现类之五:Properties

(1)Properties 类是 Hashtable 的子类,该对象用于处理属性文件 由于属性文件里的 key、value 都是字符串类型,所以 Properties 里的 key 和 value 都是字符串类型

(2)存取数据时,建议使用setProperty(String key,String value)方法和 getProperty(String key)方法

七、总结-开发中如何选择集合实现类

在开发中,遊择什么集合实现美,主要取决于业务操作特点,然后根据集合安现类特性进行
选择,分析如下:
1)先判断存储的类型(一组对象或一组键值对)

2)一组对象:Collection接口
允许重复:List
增删多:LinkedList [底层维护了一个双向链表]
改查多:Arraylist[底层维护 Object类型的可变数组]
不允许重复: Set
无序:Hashset[席层是HashMap,维护了一个哈希表 即(数组+链表+红黑树)】
排序:TreeSet
插入和取出顺序一致:LinkedHashSet,维护数组+双向链表

3)一组键值对:Map接口
键无序:HashMap[底层是:哈希表 jdk7:数组+链表,jdk8:数组+链表+红黑树]
键排序:TreeMap
鍵插入和取出順序一致: LinkedHashMap
读取文件 Properties

欢迎关注我的其它发布渠道