前言

参考文章：

感谢原创作者

一、Java集合框架概述

面向对象语言对事物的体现都是以对象的形式，为了方便对多个对象的操作，就要对对象进行存储。使用Array存储对象方面具有一些弊端，而Java集合就像一种容器，可以动态地把多个对象的引用放入容器中。

1.1 数组Array存储

（1）数组在内存存储方面的特点 ：

数组初始化以后，长度就确定了。
数组声明的类型，就决定了进行元素初始化的类型。

（2）数组在存储数据方面的弊端：

数组初始化以后，长度就不可变了，不便于拓展。
数组中提供的属性和方法少，不便于进行添加、删除、插入等操作，且效率不高。同时无法直接获取存储元素的个数。

数组存储的数据是有序的、可以重复的。—->存储数据的特点单一。

1.2 Java集合类存储

Java集合类可以用于存储数量不等的多个对象，还可以用于保存具有映射关系的关联数组。

1.3 Java集合体系

Collection接口

单列数据，定义了存取一组对象的方法的集合

①List：元素有序、可重复的集合

②Set：元素无序、不可重复的集合

（2）Map接口
双列数据，保存具有映射关系“key-value对”的集合。

1.4 Collection继承树

List特点：此处顺序并不是大小顺序，而是存入数据的先后顺序。有序因为List集合都有下标，下标从0开始，以递增。

Set特点：取出顺序不一定为存入顺序，另外Set集合没有下标。

ArrayList是非线程安全的。

HashSet集合在new的时候，底层实际上new了一个HashMap集合。向HashSet集合中存储元素，实际上是存储到了HashMap的key中了。HashMap集合是一个Hash表数据结构。

TreeSet集合底层实际上是TreeMap。TreeSet集合在new的时候，底层实际上new了一个TreeMap集合。向TreeSet集合中存储元素，实际上是存储到了TreeMap的key中了。TreeMap集合是一个二叉树数据结构。

|----Collection接口：单列集合，用来存储一个一个的对象
     |----List接口：一种包含有序元素的线性表，可存储有序的、可重复的数据。
                    可以存放多个null值。      -->“动态”数组
           |----ArrayList：作为List接口的主要实现类,多用于频繁的改查操作,线程不安全的,效率高;
                           底层采用Object[] elementData数组存储。
           |----LinkedList:对于频繁的插入删除操作,使用此类效率比ArrayList效率高,线程也不安全                                     
                           底层采用双向链表存储
           |----Vector：作为List的古老实现类，线程安全的，效率低;
                           底层采用Object[]数组存储
           
     |----Set接口：存储无序的、不可重复的数据   -->数学概念上的“集合”
           |----HashSet：作为Set接口主要实现类;线程不安全;可以存null值
                         底层采用数组+链表+红黑树
           		|----LinkedHashSet：作为HashSet的子类;遍历其内部数据时，可以按照添加顺序遍历;对于频繁的遍历操作，LinkedHashSet效率高于HashSet.
                          底层采用数组+双向链表+红黑树
           |----TreeSet：可以按照添加对象的指定属性，进行排序。
                           底层采用红黑树

1.5 Map接口继承树

|----Map:双列数据，存储key-value对的数据
     |----HashMap:作为Map的主要实现类；线程不安全的，效率高；可存储key和value可以为null,且值（value）可以存在多个null，键（key）只能出现一个null，若key中出现多个null，其结果是对第一个null的值进行覆盖
          |----LinkedHashMap:保证在遍历map元素时，可以照添加的顺序实现遍历。
                    原因：在原的HashMap底层结构基础上，添加了一对指针，指向前一个和后一个元素。对于频繁的遍历操作，此类执行效率高于HashMap。
     |----TreeMap:保证照添加的key-value对进行排序，实现排序遍历。此时考虑key的自然排序或定制排序，底层使用红黑树
     |----Hashtable:作为古老的实现类；线程安全的，效率低；不能存储null的key和value
          |----Properties:常用来处理配置文件。key和value都是String类型

二、Collection接口

2.1 collection接口简介

(1)Collection 接口是List、Set和Queue接口的父接口，该接口里定义的方法既可用于操作Set集合，也可用于操作List和Queue集合。

（2）JDK不提供此接口的任何直接实现，而是提供更具体的子接口（如：Set和List实现）。

（3）在Java5之前，Java集合会丢失容器中所有对象的数据类型，把所有对象都当成Object类型处理；从JDK5.0增加了泛型之后，Java集合可以记住容器中对象的数据类型。

2.2 collection接口常用方法

1、添加
add(Object obj)
addAll(Collection coll)
2、获取有效元素个数
int size()
3、清空集合
void clear()
4、判断是否为空集合
boolean isEmpty()
5、是否包含某个元素
boolean contains(Object obj):是通过元素的equals方法来判断是否是同一个对象
boolean containsAll(Collection c):也是调用元素的equals方法来比较的。用两个两个集合的元素逐一比较
6、删除
boolean remove(Object obj):通过元素的equals方法判断是否是要删除的那个元素。只会删除找到的第一个元素
boolean removeAll(Collection coll):取当前集合的差集
取两个集合的交集
boolean retainAll(Collection c):把交集的结果存在当前的集合中，不影响c
7、集合是否相等
boolean equals(Object obj)
8、转换成对象数组
Object [] toArray()
9、获取集合对象的哈希值
hashCode()
10、遍历
iterator()：返回迭代器对象，用于集合遍历

三、Iterator迭代器接口

3.1 使用Iterator接口遍历集合元素

（1）Iterator对象称为迭代器（设计模式的一种），主要用于遍历Collection集合中的元素。

（2）GOF给迭代器模式的定义为：提供一种方法访问一个容器（container）对象中各个元素，而又不需暴露该对象的内部细节。迭代器模式，就是为容器而生。类似于“公交车上的售票员”、“空姐”、“火车上的乘务员”。

（3）Collection 接口继承了java.lang.Iterable接口，该接口有一个iterator()方法，那么所有实现了Collection接口的集合类都有一个iterator（）方法，用以返回一个实现了Iterator接口的对象。

（4）Iterator仅用于遍历集合，Iterator本身并不提供承装对象的能力。如果需要创建Iterator对象，则必须有一个被迭代的集合。

（5）集合对象每次调用iterator（）方法都能得到一个全新的迭代器对象，默认游标都在集合的第一个元素之前。

3.2 Iterator接口的方法

（1）boolean hasNext（）：判断是否还有下一个元素。

（2）E next（）：操作：指针下移，将下移以后集合位置上的元素返回

（3）void remove（）：删除元素。

注意：

①：在调用it.next（）方法之前必须要调用it.hasNext（）进行检测。若不调用，且下一条记录无效，直接调用it.next（）会抛出NoSuchElementException异常.

②：Iterator可以删除集合的元素，但是是遍历过程中通过迭代器对象的remove方法，不是集合对象的remove方法。

③：如果还未调用next()或在上一次调用naxt方法之后已经调用了remove方法，再调用remove 都会报IllegalStateException。

3.3 使用foreach循环遍历集合元素

（1）Java5.0提供了foreach循环迭代访问Collection和数组。

（2）遍历操作不需获取Collection或数组的长度，无需使用索引访问元素。

（3）遍历集合的底层调用Iterator完成操作。

（4）foreach还可以用来遍历数组。

四、Collection子接口-List接口

4.1 List接口概述

（1）鉴于Java中数组用来存储数据的局限性，我们通常使用List替代数组

（2）List集合类中元素有序、且可重复，集合中的每个元素都有其对应的顺序索引。

（3）List容器中的元素都对应一个整数型的序号记载其在容器中的位置，可以根据序号存取容器中的元素。

（4）JDK API中List接口的实现类常用的有：ArrayList、LinkedList和Vector。

4.2 List接口方法

List除了从Collection集合继承的方法外，List集合里添加了一些根据索引来操作集合元素的方法。

（1）void add(int index,Object ele):在index位置插入ele元素。

（2）boolean addAll(int index,Collection eles):从index位置开始将eles中的所有元素添加进来。

（3）Object get(int index):获取指定index位置的元素。

（4）int indexOf(Object obj):返回obj在集合中首次出现的位置。

（5）int lastIndexOf(Object obj):返回obj在集合中末次出现的位置。

（6）Object remove(int index):移除指定Index位置的元素，并返回此元素。

（7）Object set(int index,Object ele):设置指定index位置的元素为ele。

（8）List subList(int fromIndex,int toIndex):返回从fromIndex到toIndex位置的子集合。

4.3 List实现类之一：ArrayList

（1）ArrayList 是List接口的典型实现类、主要实现类。

（2）本质上，ArrayList是对象引用的一个“变长”数组。

（3）ArrayList的JDK1.8之前与之后的实现区别？

    JDK1.7：ArrayList像饿汉式，直接创建一个初始容量为10的数组

    JDK1.8：ArrayList像懒汉式，一开始创建一个长度为0的数组，当添加第一个元素时在创建一个始容量为10的数组。

（4）Arrays.List(…)方法返回的List集合，既不是ArrayList实例，也不是Vector实例。ArrayList(…)返回值是一个固定长度的List集合。

4.4 List实现类之二：LinkedList

（1）对于频繁的插入或删除元素的操作，建议使用LinkedList类，效率较高。

（2）新增方法：

    void addFirst（Object obj)

    void addLast(Object obj)

    Object getFirst()

    Object getLast()

    Object removeFirst()

    Object removeLast()

(3)LinkedList：双向链表，内部没有声明数组，而是定义了Node类型的first和last，用于记录首末元素。同时，定义内部类Node，作为LinkedList中保存数据的基本结构。Node除了保存数据，还定义了两个变量：

prev变量记录前一个元素的位置
next变量记录下一个元素的位置

5.5 List实现类之三：Vector

（1）Vector是一个古老的集合，JDK1.0就有了。大多数操作与ArrayList相同，区别之处在于Vector是线程安全的。

（2）在各种list中，最好把ArrayList作为缺省选择。当插入、删除频繁时，使用LinkedList。Vector总是比ArrayList慢，所以尽量避免使用。

（3）新增方法：

    void addElement(Object obj)

    void insertElement(Object obj,int index)

    void set ElementAt(Object obj,int index)

    void removeElement(Object obj)

    void removeAllElements()

5.6 相应面试题

（1）ArrayList、LinkedList的异同：二者都线程不安全，相对线程安全的Vector，执行效率高。此外，ArrayList是实现了基于动态数组的数据结构，LinkedList基于链表的数据结构。对于随机访问get和set，ArrayList优先于LinkedList,因为LinkedList要移动指针。对于新增和删除操作add(特指插入)和remove，LinkedList比较占优势，因为ArrayList要移动数据。

（2）ArrayList和Vector的区别：ArrayList和Vector几乎是完全相同的，唯一的区别是在于Vector是同步类（synchronized),属于强同步类。因此开销就比ArrayList要大，访问要慢。正常情况下，大多数的程序员使用ArrayList而不是Vector，因为同步完全可以由程序员自己来控制。Vector每次扩容请求其大小的两倍空间，而ArrayList是1.5倍。Vector还有一个子类Stack。

五、Collection子接口-Set接口

5.1 Set接口概述

（1）Set接口是Collection的子接口，set接口没有提供额外的方法。

（2）Set集合不允许包含相同的元素，如果试把两个相同的元素加入同一个Set集合中，则添加操作失败。

（3）Set判断两个对象是否相同不是使用==运算符，而是根据equals()方法。

5.2 Set实现类之一:HashSet

（1）HashSet概述
①HashSet是Set接口的典型实现，大多数时候使用Set集合时都是用这个实现类。

    ②HashSet按Hash算法来存储集合中的元素，因此具有很好的存取、查找、删除性能。

    ③HashSet具有的特点：

            >不能保证元素的排列顺序

            >HashSet不是线程安全的

            >集合元素可以是null

    ④HashSet集合判断两个元素相等的标准：两个对象通过hashCode()方法比较相等，并且两个对象的equals()方法返回值也相同

    ⑤对于存放在Set容器中的对象，对应的类一定要重写equals()和hashCode(Object obj)方法，以实现对象相等原则。即：“相等的对象必须具有相等的散列码”。

（2）向HashSet中添加元素的过程
①当向HashSet集合中存入一个元素时，HashSet会调用该对象的hashCode()方法来得到该对象的hashCode值，然后根据hashCode值，通过某种散列函数决定该对象在HashSet底层数组中的存储位置。（这个散列函数会与底层数组的长度相计算得到在数组中的下标，并且这种散列函数计算还尽可能保证能均匀存储元素，越是散列分布，该散列函数设计的越好）

    ②如果两个元素的hashCode()值相等，会在调用equals方法，如果equals方法结果为true，添加失败；如果为false，那么会保存该元素，但是该数组的位置已经有元素了，那么会通过链表的方式继续连接。

    ③如果两个元素的equals()方法返回为true，但他们的hashCode()返回值不相等，hashSet将会把它们存储在不同的位置，但依然可以添加成功。

（3）重写hashCode()方法的基本原则
①在程序运行时，同一个对象多次调用hashCode()方法应该返回相同的值。

    ②当两个对象的equals()方法比较返回为true时，这两个对象的hashCode()方法的返回值也应相等。

③对象中用作equals()方法比较的Field，都应该用来计算hashCode值。

（4）重写equals()方法的基本准则
①当一个类有自己特有的“逻辑相等”概念，当改写equals()的时候，总是要改写hashCode(），根据一个类的equals()方法（改写之后），两个截然不同的实例有可能是在逻辑上是相等的，但是，根据Object.hashCode()方法，它们仅仅是两个对象。

    ②因此违反了“相等的对象必须具有相等的散列码”。
   
      ③结论：复写equals方法的时候一般需要同时复写hashCode方法。通常参与计算hashCode的对象的属性也应该参与到equals()中进行计算

5.3 Set实现类之二:LinkedHashSet

（1）LinkedHashSet是HashSet的子类

（2）LinkedHashSet根据元素的hashCode来决定元素的存储位置，但它同时使用双向链表维护元素的次序，这使得元素看起来是以插入顺序保存的。

（3）LinkedHashSet插入性能略低于HashSet，但在迭代访问Set里的全部元素时有很好的性能。

（4）LinkedHashSet不允许集合元素重复

5.4 Set实现类之三:TreeSet

（1）Tree概述
①Tree是SortedSet接口的实现类，TreeSet可以确保集合元素除余排序状态。

    ②Tree底层使用红黑树结构存储数据。

    ③新增的方法：（了解）

            >Comparator comparator()                   >Object higher(Object e)

            >Object first()                             >SortedSet subSet(fromElement,toElement)

            >Object last()                             >SortedSet headSet(toElement)

            >Object lower(Object e)             >SortedSet taiSet(fromElement)

    ④Tree两种排序方法：自然排序和定制排序。默认情况下，Tree采用自然排序。

    ⑤TreeSet和后面的TreeMap采用红黑树的存储结构。特点：有序，查询速度比List快。

（2）排序–自然排序
①自然排序：Tree会调用集合元素的compareTo(Object obj)方法来比较元素之间的大小关系，然后将集合元素按升序（默认情况）排列

    ②如果试图把一个对象添加到TreeSet时，则该对象的类必须实现Comparable接口

            >实现Comparable的类必须实现compareTo(Object obj）方法，两个对象即通过        compareTo(Object obj)方法的返回值来比较大小。

    ③Comparable的典型实现：

            >BigDecimal、BigInteger以及所有的数值型对应的包装类：按它们对应的数值大小进行  比较。

            >Character:按字符的unicode值来进行比较。

            >Boolean:true对应的包装类实例大于false对应的包装类实例。

            >String: 按字符中字符的unicode值进行比较。

            >Date、Time:后边的时间、日期比前面的时间、日期大向

    ④向 TreeSet 中添加元素时，只有第一个元素无须比较compareTo()方法，后面添 加的所有元素都会调用compareTo()方法进行比较。

    ⑤因为只有相同类的两个实例才会比较大小，所以向 TreeSet 中添加的应该是同 一个类的对象。

    ⑥对于 TreeSet 集合而言，它判断两个对象是否相等的唯一标准是：两个对象通 过 compareTo(Object obj) 方法比较返回值。

    ⑦当需要把一个对象放入 TreeSet 中，重写该对象对应的 equals() 方法时，应保 证该方法与 compareTo(Object obj) 方法有一致的结果：如果两个对象通过 equals() 方法比较返回 true，则通过 compareTo(Object obj) 方法比较应返回 0。 否则，让人难以理解。

（3）排序–定制排序
①TreeSet的自然排序要求元素所属的类实现Comparable接口，如果元素所属的类没有实现Comparable接口，或不希望按照升序(默认情况)的方式排列元素或希望按照其它属性大小进行排序，则考虑使用定制排序。定制排序，通过Comparator接口来实现。需要重写compare(T o1,T o2)方法。

    ②利用int compare(T o1,T o2)方法，比较o1和o2的大小：如果方法返回正整数，则表 示o1大于o2；如果返回0，表示相等；返回负整数，表示o1小于o2。

    ③要实现定制排序，需要将实现Comparator接口的实例作为形参传递给TreeSet的构造器。

    ④此时，仍然只能向TreeSet中添加类型相同的对象。否则发生ClassCastException异常

    ⑤使用定制排序判断两个元素相等的标准是：通过Comparator比较两个元素返回了0。

六、Map接口

6.1 Map接口概述

① Map与Collection并列存在。用于保存具有映射关系的数据:key-value ，Map 中的 key 和 value 都可以是任何引用类型的数据

② Map 中的 key 用Set来存放，不允许重复，即同一个 Map 对象所对应的类，须重写hashCode()和equals()方法

③ 常用String类作为Map的“键” ，key 和 value 之间存在单向一对一关系，即通过指定的 key 总能找到唯一的、确定的 value

④ Map接口的常用实现类：HashMap、TreeMap、LinkedHashMap和 Properties。其中，HashMap是 Map 接口使用频率最高的实现类

6.2 Map接口常用方法

① 添加、删除、修改操作：

> Object put(Object key,Object value)：将指定key-value添加到(或修改)当前map对象中

> void putAll(Map m):将m中的所有key-value对存放到当前map中

> Object remove(Object key)：移除指定key的key-value对，并返回value

> void clear()：清空当前map中的所有数据

② 元素查询的操作：

> Object get(Object key)：获取指定key对应的value

> boolean containsKey(Object key)：是否包含指定的key

> boolean containsValue(Object value)：是否包含指定的value

> int size()：返回map中key-value对的个数

> boolean isEmpty()：判断当前map是否为空  boolean equals(Object obj)：判断当前map和参数对象obj是否相等

③ 元视图操作的方法：

> Set keySet()：返回所有key构成的Set集合

> Collection values()：返回所有value构成的Collection集合

> Set entrySet()：返回所有key-value对构成的Set集合

6.3 Map实现类之一：HashMap

（1）HashMap概述
①HashMap是Map接口使用频率最高的实现类。

②允许使用null键和null值，与HashSet一样，不保证映射的顺序。

③所有的key构成的集合是Set：无序的、不可重复的。所以，key所在的类要重写equals()和hashCode（）

④所有的value构成的集合是Collection：无序的、可以重复的。所以，value所在的类要重写equals()

⑤一个key-value构成一个entry

⑥所有的entry构成的集合是Set:无序的、不可重复的

⑦HashMap 判断两个key相等的标准是：两个key通过equals()方法返回true，hashCode值也相等。

⑧HashMap 判断两个value相等的标准是：两个value通过equals()方法返回true。

6.4 Map实现类之二：LinkedHashMap

（1） LinkedHashMap概述
①LinkedHashMap是HashMap的子类

②在HashMap存储结构的基础上，使用了一堆双向链表来记录添加元素的顺序

    ③与LinkedHashSet类似，LinkedHashMap可以维护Map的迭代顺序：迭代顺序与Key-Value对的插入顺序一致

6.5 Map实现类之三：TreeMap

（1）TreeMap存储 Key-Value 对时，需要根据 key-value 对进行排序。 TreeMap 可以保证所有的 Key-Value 对处于有序状态。

（2）TreeSet底层使用红黑树结构存储数据

（3）TreeMap 的 Key 的排序：

    >自然排序：TreeMap 的所有的 Key 必须实现 Comparable 接口，而且所有 的 Key 应该是同一个类的对象，否则将会抛出 ClasssCastException

    >定制排序：创建 TreeMap 时，传入一个 Comparator 对象，该对象负责对 TreeMap 中的所有 key 进行排序。此时不需要 Map 的 Key 实现 Comparable 接口

（4） TreeMap判断两个key相等的标准：两个key通过compareTo()方法或者compare()方法返回0。

6.6 Map实现类之四：Hashtable

（1）Hashtable是个古老的 Map 实现类，JDK1.0就提供了。不同于HashMap， Hashtable是线程安全的。

（2） Hashtable实现原理和HashMap相同，功能相同。底层都使用哈希表结构，查询速度快，很多情况下可以互用。

（3）与HashMap不同，Hashtable 不允许使用 null 作为 key 和 value

（4）与HashMap一样，Hashtable 也不能保证其中 Key-Value 对的顺序

（5）Hashtable判断两个key相等、两个value相等的标准，与HashMap一致。

6.7 Map实现类之五：Properties

（1）Properties 类是 Hashtable 的子类，该对象用于处理属性文件 由于属性文件里的 key、value 都是字符串类型，所以 Properties 里的 key 和 value 都是字符串类型

（2）存取数据时，建议使用setProperty(String key,String value)方法和 getProperty(String key)方法

七、总结-开发中如何选择集合实现类

在开发中，遊择什么集合实现美，主要取决于业务操作特点，然后根据集合安现类特性进行
选择，分析如下：
1）先判断存储的类型（一组对象或一组键值对）

2）一组对象：Collection接口
允许重复：List
增删多：LinkedList [底层维护了一个双向链表]
改查多：Arraylist[底层维护 Object类型的可变数组]
不允许重复: Set
无序：Hashset[席层是HashMap，维护了一个哈希表即（数组＋链表＋红黑树）】
排序：TreeSet
插入和取出顺序一致：LinkedHashSet，维护数组＋双向链表

3）一组键值对：Map接口
键无序：HashMap[底层是：哈希表 jdk7：数组＋链表，jdk8：数组＋链表＋红黑树]
键排序：TreeMap
鍵插入和取出順序一致： LinkedHashMap
读取文件 Properties

前言