HashSet
HashSet 是一个不允许存储重复元素的集合,它是基于 HashMap 实现的, HashSet 底层使用 HashMap 来保存所有元素,因此 HashSet 的实现比较简单,相关 HashSet 的操作,基本上都是直接调用底层 HashMap 的相关方法来完成。所以只要理解了 HashMap,HashSet 就水到渠成了。
成员变量
首先了解下HashSet的成员变量:
1 | private transient HashMap<E,Object> map; |
发现主要就两个变量:
map:用于存放最终数据的。PRESENT:是所有写入map的value值。
构造方法
1 | public HashSet() { |
构造函数很简单,利用了HashMap初始化了map。
add
1 | public boolean add(E e) { |
比较关键的就是这个 add() 方法。 可以看出它是将存放的对象当做了 HashMap 的健,value 都是相同的 PRESENT 。由于 HashMap 的 key 是不能重复的,所以每当有重复的值写入到 HashSet 时,value 会被覆盖,但 key 不会受到影响,这样就保证了 HashSet 中只能存放不重复的元素。
该方法如果添加的是在 HashSet 中不存在的,则返回 true;如果添加的元素已经存在,返回 false。其原因在于我们之前提到的关于 HashMap 的 put 方法。该方法在添加 key 不重复的键值对的时候,会返回 null。
总结
HashSet 的原理比较简单,几乎全部借助于 HashMap 来实现的。
所以 HashMap 会出现的问题 HashSet 依然不能避免。
对于 HashSet 中保存的对象,请注意正确重写其 equals 和 hashCode 方法,以保证放入的对象的唯一性。这两个方法是比较重要的。