HashSet 是一个不允许存储重复元素的集合,它是基于 HashMap 实现的, HashSet 底层使用 HashMap 来保存所有元素,因此 HashSet 的实现比较简单,相关 HashSet 的操作,基本上都是直接调用底层 HashMap 的相关方法来完成。所以只要理解了 HashMap,HashSet 就水到渠成了。

成员变量

首先了解下HashSet的成员变量:

1
2
3
4
private transient HashMap<E,Object> map;

// Dummy value to associate with an Object in the backing Map
private static final Object PRESENT = new Object();

发现主要就两个变量:

  • map :用于存放最终数据的。
  • PRESENT :是所有写入mapvalue值。

构造方法

1
2
3
4
5
6
7
public HashSet() {
map = new HashMap<>();
}

public HashSet(int initialCapacity, float loadFactor) {
map = new HashMap<>(initialCapacity, loadFactor);
}

构造函数很简单,利用了HashMap初始化了map

add

1
2
3
public boolean add(E e) {
return map.put(e, PRESENT)==null;
}

比较关键的就是这个 add() 方法。 可以看出它是将存放的对象当做了 HashMap 的健,value 都是相同的 PRESENT 。由于 HashMapkey 是不能重复的,所以每当有重复的值写入到 HashSet 时,value 会被覆盖,但 key 不会受到影响,这样就保证了 HashSet 中只能存放不重复的元素。

该方法如果添加的是在 HashSet 中不存在的,则返回 true;如果添加的元素已经存在,返回 false。其原因在于我们之前提到的关于 HashMapput 方法。该方法在添加 key 不重复的键值对的时候,会返回 null

总结

HashSet 的原理比较简单,几乎全部借助于 HashMap 来实现的。

所以 HashMap 会出现的问题 HashSet 依然不能避免。

对于 HashSet 中保存的对象,请注意正确重写其 equalshashCode 方法,以保证放入的对象的唯一性。这两个方法是比较重要的。