HashMap 的基础结构,必须掌握!
创始人
2025-07-01 14:00:47
0

HashMap 是一种散列表,它存储的内容是键值对(key-value)映射。在 HashMap 中,每个键(key)映射到一个值(value)。散列表的工作原理是:当通过 put() 方法将键值对存储在 HashMap 中时,HashMap 首先会根据键的 hashCode 值来计算出存储位置,然后将键值对存储在该位置上。当通过 get() 方法获取键值对时,HashMap 再根据键的 hashCode 值来获取存储位置,然后返回该位置上的值。

hash算法的优化:对每个hash值,在它的低16位中,让高低16位进行异或,让它的低16位同时保持了高低16位的特征,尽量避免一些hash值后续出现冲突,大家可能会进入数组的同一位置。

对寻址算法的优化

(p = tab[i = (n - 1) & hash] 
 
 // (n-1) & hash ==> 数组里的一个位置

hash & (n-1) 效果是跟hash对n取模是一样的,但是与运算的性能要比hash对n取模要高很多。数组的长度会一直是2的n次方,只要他保持数组长度是2的n次方。

  • 寻址为什么不用取模?

对于上面寻址算法,由于计算机对比取模,与运算会更快。所以为了效率,HashMap 中规定了哈希表长度为 2 的 k 次方,而 2^k-1 转为二进制就是 k 个连续的 1,那么 hash & (k 个连续的 1) 返回的就是 hash 的低 k 个位,该计算结果范围刚好就是 0 到 2^k-1,即 0 到 length - 1,跟取模结果一样。

也就是说,哈希表长度 length 为 2 的整次幂时, hash & (length - 1) 的计算结果跟 hash % length 一样,而且效率还更好。

  • 为什么不直接用 hashCode() 而是用它的高 16 位进行异或计算新 hash 值?#

int 类型占 32 位,可以表示 2^32 种数(范围:-2^31 到 2^31-1),而哈希表长度一般不大,在 HashMap 中哈希表的初始化长度是 16(HashMap 中的 DEFAULT_INITIAL_CAPACITY),如果直接用 hashCode 来寻址,那么相当于只有低 4 位有效,其他高位不会有影响。这样假如几个 hashCode 分别是 210、220、2^30,那么寻址结果 index 就会一样而发生冲突,所以哈希表就不均匀分布了。

寻址算法的优化:用与运算替代取模,提升性能。(由于计算机对比取模,与运算会更快)。

在 JDK1.8 中,HashMap 的结构由数组和链表(或红黑树)组成。数组是 HashMap 的主体,链表和红黑树则是为了解决哈希冲突而存在的。从上图可以看出,HashMap 由一个个 Node 节点组成,每个节点包含了键值对的信息,以及指向下一个节点的指针。HashMap 内部维护了一个数组 table,每个元素都是一个链表的头节点(或者是一个红黑树的根节点),当多个键映射到同一个位置时,它们会被存储在同一个链表中(或者是同一个红黑树中)。当链表长度超过阈值(默认为 8)时,链表就会被转换成红黑树(如下图),这样可以提高查找效率。如果红黑树的节点数小于等于6,那么就将红黑树转换回链表,以节省空间。

转换红黑树

在 JDK1.8 中,HashMap 还引入了一个新的概念,叫做负载因子(load factor),它是指哈希表中键值对的数量与数组长度的比值。当键值对的数量超过了负载因子与数组长度的乘积时,就会触发扩容操作,HashMap 会自动将数组长度扩大一倍,并将原来的键值对重新分配到新的数组中。这样做的目的是为了保证散列表的性能,因为当负载因子过高时,散列表的性能会急剧下降。

相关内容

热门资讯

如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...
Windows恶意软件20年“... 在Windows的早期年代,病毒游走于系统之间,偶尔删除文件(但被删除的文件几乎都是可恢复的),并弹...
20个非常棒的扁平设计免费资源 Apple设备的平面图标PSD免费平板UI 平板UI套件24平图标Freen平板UI套件PSD径向平...
德国电信门户网站可实时显示全球... 德国电信周三推出一个门户网站,直观地实时提供其安装在全球各地的传感器网络检测到的网络攻击状况。该网站...
着眼MAC地址,解救无法享受D... 在安装了DHCP服务器的局域网环境中,每一台工作站在上网之前,都要先从DHCP服务器那里享受到地址动...
为啥国人偏爱 Mybatis,... 关于 SQL 和 ORM 的争论,永远都不会终止,我也一直在思考这个问题。昨天又跟群里的小伙伴进行...