HashMap底层实现与扩容原理深度解析

一、底层数据结构

1.1 核心组成

数组：存储元素的入口（桶），长度始终为2的幂次方
链表/红黑树：解决哈希冲突，JDK 1.8后链表长度>8时转为红黑树

Node结构：

static class Node<K,V> implements Map.Entry<K,V> {
    final int hash;    // 哈希值
    final K key;       // 键
    V value;           // 值
    Node<K,V> next;    // 链表指针
}

1.2 数据存储流程

计算哈希值：hash(key.hashCode())（高位异或低位增强散列）
定位桶位置：index = (n-1) & hash（n为数组长度）
处理冲突：
- 空桶：直接插入新节点
- 非空桶：遍历链表/红黑树，存在相同key则覆盖，否则追加尾部

二、扩容机制详解

2.1 触发条件

负载因子：默认0.75（容量 * 负载因子 = 阈值）
扩容阈值：当元素数量超过阈值时触发扩容

2.2 扩容过程

graph TD
    A[触发扩容] --> B{创建新数组}
    B -->|容量翻倍| C[2倍原容量]
    B -->|最大容量限制| D[设为2^30]
    C --> E[元素重哈希]
    E --> F[高低位链表拆分]
    F --> G[重新分配元素]

2.3 扩容细节

新数组创建：

int newCap = oldCap << 1;  // 容量翻倍
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];

元素迁移：
- 单节点：直接计算新位置
- 链表：拆分为低位链表（原位置）和高位链表（原位置+旧容量）
- 红黑树：调用split()方法拆分到新数组

2.4 JDK 1.8优化

尾插法：解决JDK 1.7头插法导致的死循环问题
红黑树转换：链表长度>8且数组>64时转换
哈希计算优化：hash(key) ^ (hash >>> 16)增强散列

三、关键参数与性能

3.1 核心参数

参数	默认值	作用
initialCapacity	16	初始容量
loadFactor	0.75	负载因子，触发扩容阈值计算依据
threshold	动态计算	扩容触发阈值（capacity * loadFactor）

3.2 性能影响

扩容成本：O(n)时间复杂度，需重新计算所有元素位置

最佳实践：

// 预估容量计算公式
int expectedSize = 1000000;
int initialCapacity = (int)(expectedSize / 0.75) + 1;

四、线程安全与替代方案

4.1 线程安全问题

非同步设计：多线程并发put可能导致数据覆盖

解决方案：

Map<String, String> safeMap = Collections.synchronizedMap(new HashMap<>());

4.2 高并发替代方案

实现类	特性
ConcurrentHashMap	分段锁，支持高并发读写
LinkedHashMap	保持插入顺序，继承自HashMap
EnumMap	键为枚举类型，内存效率更高

五、源码关键点解析

5.1 putVal方法流程

final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;  // 初始化数组
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);  // 直接插入
    else {
        Node<K,V> e; K k;
        if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k))))
            e = p;  // 覆盖旧值
        else if (p instanceof TreeNode)
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);  // 红黑树插入
        else {
            for (int binCount = 0; ; ++binCount) {
                if ((e = p.next) == null) {
                    p.next = newNode(hash, key, value, null);  // 链表插入
                    if (binCount >= TREEIFY_THRESHOLD - 1)  // 链表转红黑树
                        treeifyBin(tab, hash);
                    break;
                }
                if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                p = e;
            }
        }
        if (e != null) {  // 覆盖旧值
            V oldValue = e.value;
            e.value = value;
            return oldValue;
        }
    }
    if (++size > threshold)
        resize();  // 触发扩容
    return null;
}

5.2 resize方法实现

final Node<K,V>[] resize() {
    Node<K,V>[] oldTab = table;
    int oldCap = (oldTab == null) ? 0 : oldTab.length;
    int oldThr = threshold;
    int newCap, newThr = 0;
    if (oldCap > 0) {
        if (oldCap >= MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return oldTab;
        }
        newCap = oldCap << 1;  // 容量翻倍
        newThr = oldThr << 1;  // 阈值翻倍
    } else if (oldThr > 0) {
        newCap = oldThr;
    } else {
        newCap = DEFAULT_INITIAL_CAPACITY;  // 默认16
        newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);  // 默认12
    }
    // 创建新数组并迁移元素
    Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
    table = newTab;
    if (oldTab != null) {
        for (int j = 0; j < oldCap; ++j) {
            Node<K,V> e;
            if ((e = oldTab[j]) != null) {
                oldTab[j] = null;
                if (e.next == null)
                    newTab[e.hash & (newCap - 1)] = e;  // 单节点直接迁移
                else if (e instanceof TreeNode)
                    ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);  // 红黑树拆分
                else {  // 链表拆分
                    Node<K,V> loHead = null, loTail = null;
                    Node<K,V> hiHead = null, hiTail = null;
                    Node<K,V> next;
                    do {
                        next = e.next;
                        if ((e.hash & oldCap) == 0) {  // 低位链表
                            if (loTail == null)
                                loHead = e;
                            else
                                loTail.next = e;
                            loTail = e;
                        } else {  // 高位链表
                            if (hiTail == null)
                                hiHead = e;
                            else
                                hiTail.next = e;
                            hiTail = e;
                        }
                    } while ((e = next) != null);
                    if (loTail != null)
                        loTail.next = null;
                    newTab[j] = loHead;  // 低位链表放原位置
                    if (hiTail != null)
                        hiTail.next = null;
                    newTab[j + oldCap] = hiHead;  // 高位链表放新位置
                }
            }
        }
    }
    return newTab;
}

六、总结与建议

容量规划：根据预估数据量设置初始容量，避免频繁扩容
哈希优化：重写hashCode()方法保证散列均匀性
版本选择：JDK 1.8+优先使用，享受红黑树优化
监控指标：关注map.size()与threshold的关系，及时扩容

通过深入理解底层实现原理，我们可以：

避免常见的哈希碰撞问题
合理设置初始参数提升性能
在高并发场景选择合适的替代方案

养兔子的猴的博客

hashmap的底层实现和扩容原理

HashMap底层实现与扩容原理深度解析

一、底层数据结构

1.1 核心组成

1.2 数据存储流程

二、扩容机制详解

2.1 触发条件

2.2 扩容过程

2.3 扩容细节

2.4 JDK 1.8优化

三、关键参数与性能

3.1 核心参数

3.2 性能影响

四、线程安全与替代方案

4.1 线程安全问题

4.2 高并发替代方案

五、源码关键点解析

5.1 putVal方法流程

5.2 resize方法实现

六、总结与建议

养兔子的猴

HashMap底层实现与扩容原理深度解析

一、底层数据结构

1.1 核心组成

1.2 数据存储流程

二、扩容机制详解

2.1 触发条件

2.2 扩容过程

2.3 扩容细节

2.4 JDK 1.8优化

三、关键参数与性能

3.1 核心参数

3.2 性能影响

四、线程安全与替代方案

4.1 线程安全问题

4.2 高并发替代方案

五、源码关键点解析

5.1 putVal方法流程

5.2 resize方法实现

六、总结与建议

随机主键对MySQL的性能影响

Synchronized和ReentrantLock的区别

养兔子的猴