golang map的实现讲解

2023-05-14 21:05:52 map 讲解 Golang

golang是一门新兴的编程语言，它的map是基于哈希表实现的。在这篇文章中，我们将讨论Golang中map的实现方式。具体来说，我们将介绍哈希表的概念、Golang map的结构和性能优化。

哈希表的概念

哈希表是一种以键值对存储数据的数据结构。它通过哈希函数将键映射到一个数组索引，使得对操作哈希表内数据的访问变得更加高效。

哈希函数将传递给它的值计算为一个较小的固定长度值，这个值唯一地标识了这个键（这种称作哈希码）。这个哈希码被使用作为数组索引。

哈希函数存在一些问题。一是哈希碰撞，即不同的键映射到相同的数组索引，需要采用解决哈希碰撞的方式来解决。另一种问题是哈希函数的不足，它可能无法准确地计算值的哈希码，导致哈希表中的数据分布不均。

Golang map的结构

在Golang中，map是一种结构，它的底层数据结构是哈希表。具体来说，map由以下三个字段组成：

type hmap struct {
    count int                                 
    flags uint32                              
    B     uint8                               
    hash0 uint32                              
    buckets unsafe.Pointer // 指向一个桶数组
    oldbuckets unsafe.Pointer // 用于扩容时的桶数组
    nevacuate uintptr // 当前将要被载入到oldbuckets的指针位置
    extra *mapextra
}

其中，count表示map中的元素数量；flags用于记录map的状态，包括是否删除、是否迭代中等；B表示桶数组的长度，即2的B次方；hash0记录的是哈希种子，用于哈希函数的计算。

buckets是一个指针，它指向一个桶数组。桶数组的格式如下：

type bmap struct {
    tophash [bucketCnt]uint8
    data    [1]struct{ key, value interface{} }
}

其中，tophash是一个长度为bucketCnt的数组，每个元素表示bmap中的一个元素，它的值是一个整数，用于定位data中的键值对。data是一个长度为1的数组，其中包含一个键值对。键值对的格式如下：

type iface struct {
    tab  *itab
    data unsafe.Pointer
}

type itab struct {
    inter  *interfacetype
    _type  *_type
    link   *itab
    bad    int32
    inhash int32 // 是否在哈希表中
    funcbucket uintptr
    __hash uintptr // 哈希函数（方法）
    __eq   uintptr // 判断是否相等的函数（方法）
}

其中，data字段是一个指向iface结构体的指针，iface结构体包含一个指向存储键值对的指针和一个指向类型信息的指针。

Golang map的性能优化

Golang map实现的性能优化主要分为以下两个方面：

桶数组扩容

当map中的元素数量超过桶数组的容量时，桶数组需要进行扩容。扩容的方式是增加一个新的桶数组。在下一次访问map的时候，所有的键值对会被重新计算，然后被逐个移动到新的桶数组中。这个过程叫做rehash。

桶数组扩容过程中，Golang使用了一个叫做randomized-hashing的技术。这个技术通过调整哈希种子，使得在rehash的时候键值对能够更加均匀地分布在新的桶数组中，从而减少哈希碰撞。

内置的偏向锁

Golang在map中使用了一种叫做偏向锁的锁机制。偏向锁是一种优化技术，当锁只被一个go例程访问时，它将使用这个goroutine的线程ID进行加锁。这样，当这个go例程需要对锁进行解锁或重新加锁时，不需要进行线程切换，因为任何其他的go例程都不会访问这个锁。

总结

Golang中map的底层数据结构是哈希表，它的桶数组使用randomized-hashing技术对键值对进行rehash，并使用偏向锁机制进行加锁和解锁。这些实现细节使得Golang中的map在一些常见的数据结构操作中表现出了非常出色的性能。

以上就是golang map的实现讲解的详细内容，更多请关注其它相关文章！

相关文章