HashMap,开发中最常用的数据结构之一,由数组加链表组成,以key-->value键值对形式存在,HashMap的结构如下:
HashMap类中有几个关键变量
/**默认的HashMap容器初始化大小16(1右移4位) ,必须是2的幂次方**/DEFAULT_INITIAL_CAPACITY = 1 << 4/**最大的容器大小(2的30次方)**/MAXIMUM_CAPACITY = 1 << 30/**默认的加载因子,当HashMap的容量大小超过初始化容量的75%后,会自动进行扩容操作**/DEFAULT_LOAD_FACTOR = 0.75f/**阈值,当节点数超过8个会自动转化为红黑树**/TREEIFY_THRESHOLD = 8/**阈值,当节点数低于6个时会转化为链表**/UNTREEIFY_THRESHOLD = 6/**容器树化的最小表容量大小,如果没有达到该值,容器中有太多节点执行resize操作,MIN_TREEIFY_CAPACITY至少应该是TREEIFY_THRESHOLD的4倍,以防止resizing与树化阈值之间的冲突**/MIN_TREEIFY_CAPACITY = 64
HashMap中有两个重要的内部类,Node、TreeNode
Node 代表HashMap中的普通节点(未转化为红黑树之前,在jdk1.7中使用的是Entry表示),包含key,value, hash,next四个属性,Node类的结构如下:
TreeNode 代表Hahsmap中转化为红黑树后的节点(jdk1.7中不存在该类),包含left(左节点)、right(右节点)、parent(父亲节点)、prev(???)、red(树颜色的标识,非黑即红)
HashMap的构造函数
hashMap对应的构造函数有四个,使用不同的构造函数,在后续的put操作中会有一定的区别。
/**前三个构造函数都不会去初始化hashMap操作(生成node节点),在后续的put操作中会去则执行resize操作生成容量为16的hashMap对象, 第四个构造函数会根据传入的map对象大小生成一个hashMap对象**//**最简单的构造函数,没有任何参数,只会设置默认的阈值因子**/public HashMap() { this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted}/**自定义初始化容量大小,默认的阈值因子是系统默认的0.75**/public HashMap(int initialCapacity) { this(initialCapacity, DEFAULT_LOAD_FACTOR);}/**自定义初始化容量大小以及阈值因子参数,构造函数中会进行判断**/public HashMap(int initialCapacity, float loadFactor) { if (initialCapacity < 0) throw new IllegalArgumentException("Illegal initial capacity: " + initialCapacity); if (initialCapacity > MAXIMUM_CAPACITY) initialCapacity = MAXIMUM_CAPACITY; if (loadFactor <= 0 || Float.isNaN(loadFactor)) throw new IllegalArgumentException("Illegal load factor: " + loadFactor); this.loadFactor = loadFactor; this.threshold = tableSizeFor(initialCapacity);} /**传递Map参数来构造hashMap, **/public HashMap(Map m) { this.loadFactor = DEFAULT_LOAD_FACTOR; putMapEntries(m, false);}
HashMap的put操作
hashMap的put操作核心方法是putVal方法
final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) { Node[] tab; Node p; int n, i; /**如果table为空,初始化table对象, 默认生成大小为16,扩容因子为0.75的hashMap对象**/ if ((tab = table) == null || (n = tab.length) == 0) n = (tab = resize()).length; /**根据key的hashCode计算在table中存放key/value键值对的位置(前提是该位置没有存放其他键值对)**/ if ((p = tab[i = (n - 1) & hash]) == null) tab[i] = newNode(hash, key, value, null); /**计算位置已存在键值对时执行**/ else { Node e; K k; /**hash值以及key值是否相同**/ if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k)))) e = p; /**是否是红黑树节点**/ else if (p instanceof TreeNode) e = ((TreeNode )p).putTreeVal(this, tab, hash, key, value); else { /**链表形式将node节点插入到链表的后面(jdk1.7中是将Entry插入到链表的表头)**/ for (int binCount = 0; ; ++binCount) { if ((e = p.next) == null) { p.next = newNode(hash, key, value, null); /**判断是否超过8个,超过会转化为红黑树**/ if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st treeifyBin(tab, hash); break; } if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) break; p = e; } } /**如果存放新键值对的位置已存在值,且key值与新键值对相同,替换value值**/ if (e != null) { // existing mapping for key V oldValue = e.value; if (!onlyIfAbsent || oldValue == null) e.value = value; afterNodeAccess(e); return oldValue; } } ++modCount; /**判断是否需要扩容**/ if (++size > threshold) resize(); afterNodeInsertion(evict); return null;}
resize操作
resize方法是用来初始化以及扩充2倍容量的方法
final Node[] resize() { Node [] oldTab = table; int oldCap = (oldTab == null) ? 0 : oldTab.length; int oldThr = threshold; int newCap, newThr = 0; /**进行扩容操作**/ if (oldCap > 0) { /**如果hashMap容量大小已超过最大值(2^30),不在进行扩容,阈值大小设置为(2^31-1),后续都不会在扩容**/ if (oldCap >= MAXIMUM_CAPACITY) { threshold = Integer.MAX_VALUE; return oldTab; } /**扩容变成原容量的2倍,阈值也变成2倍**/ else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY && oldCap >= DEFAULT_INITIAL_CAPACITY) newThr = oldThr << 1; // double threshold } /**对应HashMap(int initialCapacity)第一次put操作初始化的时候调用**/ else if (oldThr > 0) // initial capacity was placed in threshold newCap = oldThr; /**对应HashMap()第一次put操作初始化的时候调用**/ else { // zero initial threshold signifies using defaults newCap = DEFAULT_INITIAL_CAPACITY; newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY); } /**设置阈值**/ if (newThr == 0) { float ft = (float)newCap * loadFactor; newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ? (int)ft : Integer.MAX_VALUE); } threshold = newThr; @SuppressWarnings({ "rawtypes","unchecked"}) /**对于没有初始化的初始化操作,在调用构造函数是都不会初始化,只有在put时才会初始化(以map为参数的构造函数除外,其实也是执行put时初始化)**/ Node [] newTab = (Node [])new Node[newCap]; table = newTab; if (oldTab != null) { for (int j = 0; j < oldCap; ++j) { Node e; if ((e = oldTab[j]) != null) { oldTab[j] = null; /**如果没有链表,直接赋值**/ if (e.next == null) newTab[e.hash & (newCap - 1)] = e; else if (e instanceof TreeNode) ((TreeNode )e).split(this, newTab, j, oldCap); else { // preserve order /**数据迁移部分对比: * 1.jdk1.8中将链表拆分为两个部分,一个是保存在原位置不变,一个是扩充前位置+oldCap的位置,扩容数据迁移后链表的顺序没有改变;(1.8的效率更高) * 2.jdk1.7中是通过双重循环遍历,使用node.hash & (newCapacity - 1)计算扩容后节点的位置,新节点的加入是存放到链表头,数据迁移后链表的顺序相反; **/ /**扩容后依然在扩容前位置的链表节点**/ Node loHead = null, loTail = null; /**扩容后在扩容前位置+oldCap位置的链表节点**/ Node hiHead = null, hiTail = null; Node next; do { next = e.next; if ((e.hash & oldCap) == 0) { if (loTail == null) loHead = e; else loTail.next = e; loTail = e; } else { if (hiTail == null) hiHead = e; else hiTail.next = e; hiTail = e; } } while ((e = next) != null); /**向扩容后的map中存放链表**/ if (loTail != null) { loTail.next = null; newTab[j] = loHead; } if (hiTail != null) { hiTail.next = null; newTab[j + oldCap] = hiHead; } } } } } return newTab;}
get操作
get操作获取hashMap中数据实际调用的是getNode(int hash, Object key)方法
final NodegetNode(int hash, Object key) { Node [] tab; Node first, e; int n; K k; /**判断table是否为空,根据传递的key值获取的tab是否为空,此时获取的是链表的链表头结点**/ if ((tab = table) != null && (n = tab.length) > 0 && (first = tab[(n - 1) & hash]) != null) { /**判断表头节点是否是获取的对象**/ if (first.hash == hash && // always check first node ((k = first.key) == key || (key != null && key.equals(k)))) return first; /**遍历链表获取节点**/ if ((e = first.next) != null) { if (first instanceof TreeNode) return ((TreeNode )first).getTreeNode(hash, key); do { if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) return e; } while ((e = e.next) != null); } } return null;}
remove操作
执行remove(Object key)以及remove(Object key, Object value)方法都是执行的removeNode方法
final NoderemoveNode(int hash, Object key, Object value, boolean matchValue, boolean movable) { Node [] tab; Node p; int n, index; /**判断table是否为空以及删除的key在table中是否存在**/ if ((tab = table) != null && (n = tab.length) > 0 && (p = tab[index = (n - 1) & hash]) != null) { Node node = null, e; K k; V v; /**删除节点是链表头节点**/ if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k)))) node = p; else if ((e = p.next) != null) { if (p instanceof TreeNode) node = ((TreeNode )p).getTreeNode(hash, key); else { /**删除节点非链表头的节点**/ do { if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) { node = e; break; } p = e; } while ((e = e.next) != null); } } /**执行删除操作,区分是否在表头**/ if (node != null && (!matchValue || (v = node.value) == value || (value != null && value.equals(v)))) { if (node instanceof TreeNode) ((TreeNode )node).removeTreeNode(this, tab, movable); /**链表头结点的删除**/ else if (node == p) tab[index] = node.next; /**非链表头结点的删除**/ else p.next = node.next; ++modCount; --size; afterNodeRemoval(node); return node; } } return null;}
以上的操作都是关于数组加链表的形式说明的,jdk1.8后当链表的节点个数达到8个以上时,会将链表转化为红黑树保存,当链表节点低于6个时,会再次退化为链表。