前言
参考文章:
1.https://blog.csdn.net/qq_55133453/article/details/124476889
2.https://blog.csdn.net/zdl66/article/details/126251818
3.https://blog.csdn.net/weixin_64314142/article/details/130490393
感谢原创作者
一、Java集合框架概述
面向对象语言对事物的体现都是以对象的形式,为了方便对多个对象的操作,就要对对象进行存储。使用Array存储对象方面具有一些弊端,而Java集合就像一种容器,可以动态地把多个对象的引用放入容器中。
1.1 数组Array存储
(1)数组在内存存储方面的特点 :
数组初始化以后,长度就确定了。
数组声明的类型,就决定了进行元素初始化的类型。
(2)数组在存储数据方面的弊端:
数组初始化以后,长度就不可变了,不便于拓展。
数组中提供的属性和方法少,不便于进行添加、删除、插入等操作,且效率不高。同时无法直接获取存储元素的个数。
- 数组存储的数据是有序的、可以重复的。—->存储数据的特点单一。
1.2 Java集合类存储
Java集合类可以用于存储数量不等的多个对象,还可以用于保存具有映射关系的关联数组。
1.3 Java集合体系
Collection接口
单列数据,定义了存取一组对象的方法的集合
①List:元素有序、可重复的集合
②Set:元素无序、不可重复的集合
(2)Map接口
双列数据,保存具有映射关系“key-value对”的集合。
1.4 Collection继承树
- List特点:此处顺序并不是大小顺序,而是存入数据的先后顺序。有序因为List集合都有下标,下标从0开始,以递增。
- Set特点:取出顺序不一定为存入顺序,另外Set集合没有下标。
- ArrayList是非线程安全的。
- HashSet集合在new的时候,底层实际上new了一个HashMap集合。向HashSet集合中存储元素,实际上是存储到了HashMap的key中了。HashMap集合是一个Hash表数据结构。
TreeSet集合底层实际上是TreeMap。TreeSet集合在new的时候,底层实际上new了一个TreeMap集合。向TreeSet集合中存储元素,实际上是存储到了TreeMap的key中了。TreeMap集合是一个二叉树数据结构。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17|----Collection接口:单列集合,用来存储一个一个的对象
|----List接口:一种包含有序元素的线性表,可存储有序的、可重复的数据。
可以存放多个null值。 -->“动态”数组
|----ArrayList:作为List接口的主要实现类,多用于频繁的改查操作,线程不安全的,效率高;
底层采用Object[] elementData数组存储。
|----LinkedList:对于频繁的插入删除操作,使用此类效率比ArrayList效率高,线程也不安全
底层采用双向链表存储
|----Vector:作为List的古老实现类,线程安全的,效率低;
底层采用Object[]数组存储
|----Set接口:存储无序的、不可重复的数据 -->数学概念上的“集合”
|----HashSet:作为Set接口主要实现类;线程不安全;可以存null值
底层采用数组+链表+红黑树
|----LinkedHashSet:作为HashSet的子类;遍历其内部数据时,可以按照添加顺序遍历;对于频繁的遍历操作,LinkedHashSet效率高于HashSet.
底层采用数组+双向链表+红黑树
|----TreeSet:可以按照添加对象的指定属性,进行排序。
底层采用红黑树
1.5 Map接口继承树
1 | |----Map:双列数据,存储key-value对的数据 |
二、Collection接口
2.1 collection接口简介
(1)Collection 接口是List、Set和Queue接口的父接口,该接口里定义的方法既可用于操作Set集合,也可用于操作List和Queue集合。
(2)JDK不提供此接口的任何直接实现,而是提供更具体的子接口(如:Set和List实现)。
(3)在Java5之前,Java集合会丢失容器中所有对象的数据类型,把所有对象都当成Object类型处理;从JDK5.0增加了泛型之后,Java集合可以记住容器中对象的数据类型。
2.2 collection接口常用方法
1 | 1、添加 |
三、Iterator迭代器接口
3.1 使用Iterator接口遍历集合元素
(1)Iterator对象称为迭代器(设计模式的一种),主要用于遍历Collection集合中的元素。
(2)GOF给迭代器模式的定义为:提供一种方法访问一个容器(container)对象中各个元素,而又不需暴露该对象的内部细节。迭代器模式,就是为容器而生。类似于“公交车上的售票员”、“空姐”、“火车上的乘务员”。
(3)Collection 接口继承了java.lang.Iterable接口,该接口有一个iterator()方法,那么所有实现了Collection接口的集合类都有一个iterator()方法,用以返回一个实现了Iterator接口的对象。
(4)Iterator仅用于遍历集合,Iterator本身并不提供承装对象的能力。如果需要创建Iterator对象,则必须有一个被迭代的集合。
(5)集合对象每次调用iterator()方法都能得到一个全新的迭代器对象,默认游标都在集合的第一个元素之前。
3.2 Iterator接口的方法
(1)boolean hasNext():判断是否还有下一个元素。
(2)E next():操作:指针下移,将下移以后集合位置上的元素返回
(3)void remove():删除元素。
注意:
①:在调用it.next()方法之前必须要调用it.hasNext()进行检测。若不调用,且下一条记录无效,直接调用it.next()会抛出NoSuchElementException异常.
②:Iterator可以删除集合的元素,但是是遍历过程中通过迭代器对象的remove方法,不是集合对象的remove方法。
③:如果还未调用next()或在上一次调用naxt方法之后已经调用了remove方法,再调用remove 都会报IllegalStateException。
3.3 使用foreach循环遍历集合元素
(1)Java5.0提供了foreach循环迭代访问Collection和数组。
(2)遍历操作不需获取Collection或数组的长度,无需使用索引访问元素。
(3)遍历集合的底层调用Iterator完成操作。
(4)foreach还可以用来遍历数组。
四、Collection子接口-List接口
4.1 List接口概述
(1)鉴于Java中数组用来存储数据的局限性,我们通常使用List替代数组
(2)List集合类中元素有序、且可重复,集合中的每个元素都有其对应的顺序索引。
(3)List容器中的元素都对应一个整数型的序号记载其在容器中的位置,可以根据序号存取容器中的元素。
(4)JDK API中List接口的实现类常用的有:ArrayList、LinkedList和Vector。
4.2 List接口方法
List除了从Collection集合继承的方法外,List集合里添加了一些根据索引来操作集合元素的方法。
1 | (1)void add(int index,Object ele):在index位置插入ele元素。 |
4.3 List实现类之一:ArrayList
(1)ArrayList 是List接口的典型实现类、主要实现类。
(2)本质上,ArrayList是对象引用的一个“变长”数组。
(3)ArrayList的JDK1.8之前与之后的实现区别?
JDK1.7:ArrayList像饿汉式,直接创建一个初始容量为10的数组
JDK1.8:ArrayList像懒汉式,一开始创建一个长度为0的数组,当添加第一个元素时在创建一个始容量为10的数组。
(4)Arrays.List(…)方法返回的List集合,既不是ArrayList实例,也不是Vector实例。ArrayList(…)返回值是一个固定长度的List集合。
4.4 List实现类之二:LinkedList
(1)对于频繁的插入或删除元素的操作,建议使用LinkedList类,效率较高。
(2)新增方法:
void addFirst(Object obj)
void addLast(Object obj)
Object getFirst()
Object getLast()
Object removeFirst()
Object removeLast()
(3)LinkedList:双向链表,内部没有声明数组,而是定义了Node类型的first和last,用于记录首末元素。同时,定义内部类Node,作为LinkedList中保存数据的基本结构。Node除了保存数据,还定义了两个变量:
- prev变量记录前一个元素的位置
- next变量记录下一个元素的位置
5.5 List实现类之三:Vector
(1)Vector是一个古老的集合,JDK1.0就有了。大多数操作与ArrayList相同,区别之处在于Vector是线程安全的。
(2)在各种list中,最好把ArrayList作为缺省选择。当插入、删除频繁时,使用LinkedList。Vector总是比ArrayList慢,所以尽量避免使用。
(3)新增方法:
void addElement(Object obj)
void insertElement(Object obj,int index)
void set ElementAt(Object obj,int index)
void removeElement(Object obj)
void removeAllElements()
5.6 相应面试题
(1)ArrayList、LinkedList的异同:二者都线程不安全,相对线程安全的Vector,执行效率高。此外,ArrayList是实现了基于动态数组的数据结构,LinkedList基于链表的数据结构。对于随机访问get和set,ArrayList优先于LinkedList,因为LinkedList要移动指针。对于新增和删除操作add(特指插入)和remove,LinkedList比较占优势,因为ArrayList要移动数据。
(2)ArrayList和Vector的区别:ArrayList和Vector几乎是完全相同的,唯一的区别是在于Vector是同步类(synchronized),属于强同步类。因此开销就比ArrayList要大,访问要慢。正常情况下,大多数的程序员使用ArrayList而不是Vector,因为同步完全可以由程序员自己来控制。Vector每次扩容请求其大小的两倍空间,而ArrayList是1.5倍。Vector还有一个子类Stack。
五 、Collection子接口-Set接口
5.1 Set接口概述
(1)Set接口是Collection的子接口,set接口没有提供额外的方法。
(2)Set集合不允许包含相同的元素 ,如果试把两个相同的元素加入同一个Set集合中,则添加操作失败。
(3)Set判断两个对象是否相同不是使用==运算符,而是根据equals()方法。
5.2 Set实现类之一:HashSet
(1)HashSet概述
①HashSet是Set接口的典型实现,大多数时候使用Set集合时都是用这个实现类。
②HashSet按Hash算法来存储集合中的元素,因此具有很好的存取、查找、删除性能。
③HashSet具有的特点:
>不能保证元素的排列顺序
>HashSet不是线程安全的
>集合元素可以是null
④HashSet集合判断两个元素相等的标准:两个对象通过hashCode()方法比较相等,并且两个对象的equals()方法返回值也相同
⑤对于存放在Set容器中的对象,对应的类一定要重写equals()和hashCode(Object obj)方法,以实现对象相等原则。即:“相等的对象必须具有相等的散列码”。
(2)向HashSet中添加元素的过程
①当向HashSet集合中存入一个元素时,HashSet会调用该对象的hashCode()方法来得到该对象的hashCode值,然后根据hashCode值,通过某种散列函数决定该对象在HashSet底层数组中的存储位置。(这个散列函数会与底层数组的长度相计算得到在数组中的下标,并且这种散列函数计算还尽可能保证能均匀存储元素,越是散列分布,该散列函数设计的越好)
②如果两个元素的hashCode()值相等,会在调用equals方法,如果equals方法结果为true,添加失败;如果为false,那么会保存该元素,但是该数组的位置已经有元素了,那么会通过链表的方式继续连接。
③如果两个元素的equals()方法返回为true,但他们的hashCode()返回值不相等,hashSet将会把它们存储在不同的位置,但依然可以添加成功。
(3)重写hashCode()方法的基本原则
①在程序运行时,同一个对象多次调用hashCode()方法应该返回相同的值。
②当两个对象的equals()方法比较返回为true时,这两个对象的hashCode()方法的返回值也应相等。
③对象中用作equals()方法比较的Field,都应该用来计算hashCode值。
(4)重写equals()方法的基本准则
①当一个类有自己特有的“逻辑相等”概念,当改写equals()的时候,总是要改写hashCode(),根据一个类的equals()方法(改写之后),两个截然不同的实例有可能是在逻辑上是相等的,但是,根据Object.hashCode()方法,它们仅仅是两个对象。
②因此违反了“相等的对象必须具有相等的散列码”。
③结论:复写equals方法的时候一般需要同时复写hashCode方法。通常参与计算hashCode的对象的属性也应该参与到equals()中进行计算
5.3 Set实现类之二:LinkedHashSet
(1)LinkedHashSet是HashSet的子类
(2)LinkedHashSet根据元素的hashCode来决定元素的存储位置,但它同时使用双向链表维护元素的次序,这使得元素看起来是以插入顺序保存的。
(3)LinkedHashSet插入性能略低于HashSet,但在迭代访问Set里的全部元素时有很好的性能。
(4)LinkedHashSet不允许集合元素重复
5.4 Set实现类之三:TreeSet
(1)Tree概述
①Tree是SortedSet接口的实现类,TreeSet可以确保集合元素除余排序状态。
②Tree底层使用红黑树结构存储数据。
③新增的方法:(了解)
>Comparator comparator() >Object higher(Object e)
>Object first() >SortedSet subSet(fromElement,toElement)
>Object last() >SortedSet headSet(toElement)
>Object lower(Object e) >SortedSet taiSet(fromElement)
④Tree两种排序方法:自然排序和定制排序。默认情况下,Tree采用自然排序。
⑤TreeSet和后面的TreeMap采用红黑树的存储结构。特点:有序,查询速度比List快。
(2)排序–自然排序
①自然排序:Tree会调用集合元素的compareTo(Object obj)方法来比较元素之间的大小关系,然后将集合元素按升序(默认情况)排列
②如果试图把一个对象添加到TreeSet时,则该对象的类必须实现Comparable接口
>实现Comparable的类必须实现compareTo(Object obj)方法,两个对象即通过 compareTo(Object obj)方法的返回值来比较大小。
③Comparable的典型实现:
>BigDecimal、BigInteger以及所有的数值型对应的包装类:按它们对应的数值大小进行 比较。
>Character:按字符的unicode值来进行比较。
>Boolean:true对应的包装类实例大于false对应的包装类实例。
>String: 按字符中字符的unicode值进行比较。
>Date、Time:后边的时间、日期比前面的时间、日期大向
④向 TreeSet 中添加元素时,只有第一个元素无须比较compareTo()方法,后面添 加的所有元素都会调用compareTo()方法进行比较。
⑤因为只有相同类的两个实例才会比较大小,所以向 TreeSet 中添加的应该是同 一个类的对象。
⑥对于 TreeSet 集合而言,它判断两个对象是否相等的唯一标准是:两个对象通 过 compareTo(Object obj) 方法比较返回值。
⑦当需要把一个对象放入 TreeSet 中,重写该对象对应的 equals() 方法时,应保 证该方法与 compareTo(Object obj) 方法有一致的结果:如果两个对象通过 equals() 方法比较返回 true,则通过 compareTo(Object obj) 方法比较应返回 0。 否则,让人难以理解。
(3)排序–定制排序
①TreeSet的自然排序要求元素所属的类实现Comparable接口,如果元素所属的类没 有实现Comparable接口,或不希望按照升序(默认情况)的方式排列元素或希望按照 其它属性大小进行排序,则考虑使用定制排序。定制排序,通过Comparator接口来 实现。需要重写compare(T o1,T o2)方法。
②利用int compare(T o1,T o2)方法,比较o1和o2的大小:如果方法返回正整数,则表 示o1大于o2;如果返回0,表示相等;返回负整数,表示o1小于o2。
③要实现定制排序,需要将实现Comparator接口的实例作为形参传递给TreeSet的构造器。
④此时,仍然只能向TreeSet中添加类型相同的对象。否则发生ClassCastException异常
⑤使用定制排序判断两个元素相等的标准是:通过Comparator比较两个元素返回了0。
六、Map接口
6.1 Map接口概述
① Map与Collection并列存在。用于保存具有映射关系的数据:key-value ,Map 中的 key 和 value 都可以是任何引用类型的数据
② Map 中的 key 用Set来存放,不允许重复,即同一个 Map 对象所对应的类,须重写hashCode()和equals()方法
③ 常用String类作为Map的“键” ,key 和 value 之间存在单向一对一关系,即通过指定的 key 总能找到 唯一的、确定的 value
④ Map接口的常用实现类:HashMap、TreeMap、LinkedHashMap和 Properties。其中,HashMap是 Map 接口使用频率最高的实现类
6.2 Map接口常用方法
① 添加、删除、修改操作:
1 | > Object put(Object key,Object value):将指定key-value添加到(或修改)当前map对象中 |
② 元素查询的操作:
1 | > Object get(Object key):获取指定key对应的value |
③ 元视图操作的方法:
1 | Set keySet():返回所有key构成的Set集合 |
6.3 Map实现类之一:HashMap
(1)HashMap概述
①HashMap是Map接口使用频率最高的实现类。
②允许使用null键和null值,与HashSet一样,不保证映射的顺序。
③所有的key构成的集合是Set:无序的、不可重复的。所以,key所在的类要重写equals()和hashCode()
④所有的value构成的集合是Collection:无序的、可以重复的。所以,value所在的类要重写equals()
⑤一个key-value构成一个entry
⑥所有的entry构成的集合是Set:无序的、不可重复的
⑦HashMap 判断两个key相等的标准是:两个key通过equals()方法返回true,hashCode值也相等。
⑧HashMap 判断两个value相等的标准是:两个value通过equals()方法返回true。
6.4 Map实现类之二:LinkedHashMap
(1) LinkedHashMap概述
①LinkedHashMap是HashMap的子类
②在HashMap存储结构的基础上,使用了一堆双向链表来记录添加元素的顺序
③与LinkedHashSet类似,LinkedHashMap可以维护Map的迭代顺序:迭代顺序与Key-Value对的插入顺序一致
6.5 Map实现类之三:TreeMap
(1)TreeMap存储 Key-Value 对时,需要根据 key-value 对进行排序。 TreeMap 可以保证所有的 Key-Value 对处于有序状态。
(2)TreeSet底层使用红黑树结构存储数据
(3)TreeMap 的 Key 的排序:
>自然排序:TreeMap 的所有的 Key 必须实现 Comparable 接口,而且所有 的 Key 应该是同一个类的对象,否则将会抛出 ClasssCastException
>定制排序:创建 TreeMap 时,传入一个 Comparator 对象,该对象负责对 TreeMap 中的所有 key 进行排序。此时不需要 Map 的 Key 实现 Comparable 接口
(4) TreeMap判断两个key相等的标准:两个key通过compareTo()方法或 者compare()方法返回0。
6.6 Map实现类之四:Hashtable
(1)Hashtable是个古老的 Map 实现类,JDK1.0就提供了。不同于HashMap, Hashtable是线程安全的。
(2) Hashtable实现原理和HashMap相同,功能相同。底层都使用哈希表结构,查询 速度快,很多情况下可以互用。
(3) 与HashMap不同,Hashtable 不允许使用 null 作为 key 和 value
(4)与HashMap一样,Hashtable 也不能保证其中 Key-Value 对的顺序
(5)Hashtable判断两个key相等、两个value相等的标准,与HashMap一致。
6.7 Map实现类之五:Properties
(1)Properties 类是 Hashtable 的子类,该对象用于处理属性文件 由于属性文件里的 key、value 都是字符串类型,所以 Properties 里的 key 和 value 都是字符串类型
(2)存取数据时,建议使用setProperty(String key,String value)方法和 getProperty(String key)方法
七、总结-开发中如何选择集合实现类
在开发中,遊择什么集合实现美,主要取决于业务操作特点,然后根据集合安现类特性进行
选择,分析如下:
1)先判断存储的类型(一组对象或一组键值对)
2)一组对象:Collection接口
允许重复:List
增删多:LinkedList [底层维护了一个双向链表]
改查多:Arraylist[底层维护 Object类型的可变数组]
不允许重复: Set
无序:Hashset[席层是HashMap,维护了一个哈希表 即(数组+链表+红黑树)】
排序:TreeSet
插入和取出顺序一致:LinkedHashSet,维护数组+双向链表
3)一组键值对:Map接口
键无序:HashMap[底层是:哈希表 jdk7:数组+链表,jdk8:数组+链表+红黑树]
键排序:TreeMap
鍵插入和取出順序一致: LinkedHashMap
读取文件 Properties