Sliceのcapacityはどのように増加していくか
概要
Goのsliceには容量(capacity)があります。このcapacityは、sliceに要素が追加されて足りなくなった際に、自動で増加するようになっています。
この記事では、以下の二点を検証していきます。
- capacityが増加する際にslice内部でどのような変更が行われているか
- capacity数がどのような規則で増加するか
結論だけ知りたい人用のまとめ
sliceのcapacityを増加させるときは、underlying arrayを新しいcapacityで確保し直してポイントを貼り直している。
capacityを増やす際の、新しいcapacityの計算方法は下記の通り。
- 新しいcapacity(仮)を決める。元のcapacityが1024未満なら元のcapacityの2倍、1024以上なら1.25倍する。
- 1の計算結果から、実際に確保するメモリ容量を計算する。メモリ容量はsliceの要素のtypeやメモリブロックの単位にも依存する。
- 2で計算したメモリ容量から、最終的なcapacityを計算する。
前提: sliceの構造とcapacity
前提として、あらためてsliceがどのような構造になっていて、capacityとはなにかを簡単に説明します。
すでに理解している方はこの項は読み飛ばしてください。
sliceの構造
sliceがGoの内部でどのように定義されているかを見てみましょう。
type slice struct {
array unsafe.Pointer
len int
cap int
}
ご覧のように、sliceは内部にarrayへのpointerを持っています。
つまり、sliceは、別に存在しているarrayへの参照を持ったものということになります。
このsliceが参照しているarrayのことを、underlying array (基底配列)
と呼びます。
なので、例えば、capacityとlengthが5のbyteのsliceを作成した場合は、下記のように、長さが5のbyteのarrayを内部で作成し、そちらを参照している状態になります。
引用元: Go Slices: usage and internals
詳しくは、Go Slices: usage and internalsにあります。
lengthとcapacity
上記のsliceの構造を前提として、capacity
とlength
が何であるかを定義しておきます。
一言で言ってしまえば、
capacity: underlying arrayの容量
length: underlying arrayに入っている要素の数
ということになります。
検証1: capacityが増加する際にslice内部でどのような変更が行われているか
ここまでの説明のようにsliceが内部で固定長のarrayを参照していることになると、sliceにcapacityを超える数の要素を入れたら内部のarrayはどうなるのかという疑問が湧くと思います。
この項では、そちらを検証します。
結論から言うと、underlying arrayの長さをそのまま後から変えることはできないので、underlying arrayを新しく確保してpointerを貼り直しているということになります。
実際に下記のコードで検証してみましょう。
このコードは、要素を一つずつ追加するごとに、sliceの情報やunderlying arrayのポインタを出力しています。
func main() {
s := make([]int, 0, 2)
fmt.Printf("slice: %p, cap:%v , len: %v, underlying array:%p\n", &s, cap(s), len(s), (*[0]int)(s))
s = append(s, 0)
fmt.Printf("slice: %p, cap:%v , len: %v, underlying array:%p\n", &s, cap(s), len(s), (*[1]int)(s))
s = append(s, 0)
fmt.Printf("slice: %p, cap:%v , len: %v, underlying array:%p\n", &s, cap(s), len(s), (*[2]int)(s))
s = append(s, 0)
fmt.Printf("slice: %p, cap:%v , len: %v, underlying array:%p\n", &s, cap(s), len(s), (*[3]int)(s))
}
実行すると下記のような結果が得られると思います。
slice: 0xc00000c030, cap:2 , len: 0, underlying array:0xc000018030
slice: 0xc00000c030, cap:2 , len: 1, underlying array:0xc000018030
slice: 0xc00000c030, cap:2 , len: 2, underlying array:0xc000018030
slice: 0xc00000c030, cap:4 , len: 3, underlying array:0xc00007a000
出力内容は、順番に、sliceのポインタ
、capacity
, length
, underlying arrayのポインタ
です。
(なお、underlying arrayのポインタは、Go1.17で追加された方法を利用して取得しています。)
最初にcapcityが2のsliceを作成し、一つずつ要素を足していって、それぞれの値がどのように変化していくかを出力しています。
lengthが2になるまではただlengthが増えていくだけで他は変わりないですが、capcityが足りなくなったタイミングで、capacityが2から4に増加しています。
そして、それと同時に、underlying arrayのポインタが変更されています。
つまり、このタイミングで、capacityを増やすために、underlying arrayが確保し直されていることになります。
検証2: capacity数がどのような規則で増加するか
ここまでで、sliceのcapacityが増えるときは、underlying arrayを新しく確保していることを確認しました。
次に、capacity数がどのように増えるかを見てみましょう。
以下のようなコードで試してみましょう。
func main() {
s1 := []int32{1}
fmt.Printf("cap:%v , len: %v\n", cap(s1), len(s1))
s1 = append(s1, 1)
fmt.Printf("cap:%v , len: %v\n", cap(s1), len(s1))
fmt.Println()
s2 := []int32{1, 1}
fmt.Printf("cap:%v , len: %v\n", cap(s2), len(s2))
s2 = append(s2, 1)
fmt.Printf("cap:%v , len: %v\n", cap(s2), len(s2))
fmt.Println()
s3 := []int32{1, 1, 1, 1, 1, 1, 1, 1, 1}
fmt.Printf("cap:%v , len: %v\n", cap(s3), len(s3))
s3 = append(s3, 1)
fmt.Printf("cap:%v , len: %v\n", cap(s3), len(s3))
}
実行すると、下記のようになります。
cap:1 , len: 1
cap:2 , len: 2
cap:2 , len: 2
cap:4 , len: 3
cap:9 , len: 9
cap:20 , len: 10
最初の二つは、capが1だったときは2, 2だったときは4と、2倍になっています。
ところが、三つ目では、capが9だったものが20へと増えていて、ちょうど2倍にはなっていません。
ご覧のように、capacityは、必ずしも要素を追加する際に必要な数だけ増えるわけではありません。
そして、増加量・率ともに必ずしも一定ではありません。
そこで、sliceに要素を一つ繰り返し追加していって、capacity数と増加率の遷移をもっと見てみましょう。
func main() {
var s []int
var currCap int
for i := 0; i < 10000; i++ {
s = append(s, i)
newCap := cap(s)
if currCap != newCap {
fmt.Printf("new cap %v, (new cap) / (old cap) = %v \n", newCap, float32(newCap)/float32(currCap))
currCap = newCap
}
}
}
PlayGroundで実行すると、下記のような結果が得られます。
new cap 1, (new cap) / (old cap) = +Inf
new cap 2, (new cap) / (old cap) = 2
new cap 4, (new cap) / (old cap) = 2
new cap 8, (new cap) / (old cap) = 2
new cap 16, (new cap) / (old cap) = 2
new cap 32, (new cap) / (old cap) = 2
new cap 64, (new cap) / (old cap) = 2
new cap 128, (new cap) / (old cap) = 2
new cap 256, (new cap) / (old cap) = 2
new cap 512, (new cap) / (old cap) = 2
new cap 1024, (new cap) / (old cap) = 2
new cap 1280, (new cap) / (old cap) = 1.25
new cap 1696, (new cap) / (old cap) = 1.325
new cap 2304, (new cap) / (old cap) = 1.3584906
new cap 3072, (new cap) / (old cap) = 1.3333334
new cap 4096, (new cap) / (old cap) = 1.3333334
new cap 5120, (new cap) / (old cap) = 1.25
new cap 7168, (new cap) / (old cap) = 1.4
new cap 9216, (new cap) / (old cap) = 1.2857143
new cap 12288, (new cap) / (old cap) = 1.3333334
上記の結果から、以下のようなことがわかります。
・capacityが1024になるまでは、2倍で増えていく
・1024を超えてから、増加率が低くなる
さらに、以下のように、いろんなelementのtypeでも実行してみましょう。
func main() {
fmt.Println("--in32---")
var int32s []int32
var currCap int
for i := 0; i < 100000; i++ {
int32s = append(int32s, int32(i))
newCap := cap(int32s)
if currCap != newCap {
fmt.Printf("new cap %v, (new cap) / (old cap) = %v \n", newCap, float32(newCap)/float32(currCap))
currCap = newCap
}
}
fmt.Println()
fmt.Println("--int64---")
var int64s []int64
currCap = 0
for i := 0; i < 100000; i++ {
int64s = append(int64s, int64(i))
newCap := cap(int64s)
if currCap != newCap {
fmt.Printf("new cap %v, (new cap) / (old cap) = %v \n", newCap, float32(newCap)/float32(currCap))
currCap = newCap
}
}
fmt.Println()
fmt.Println("--float32---")
var f32s []float32
currCap = 0
for i := 0; i < 100000; i++ {
f32s = append(f32s, float32(i))
newCap := cap(f32s)
if currCap != newCap {
fmt.Printf("new cap %v, (new cap) / (old cap) = %v \n", newCap, float32(newCap)/float32(currCap))
currCap = newCap
}
}
fmt.Println()
fmt.Println("--float64---")
var f64s []float64
currCap = 0
for i := 0; i < 100000; i++ {
f64s = append(f64s, float64(i))
newCap := cap(f64s)
if currCap != newCap {
fmt.Printf("new cap %v, (new cap) / (old cap) = %v \n", newCap, float32(newCap)/float32(currCap))
currCap = newCap
}
}
fmt.Println()
fmt.Println("--string---")
var strs []string
currCap = 0
for i := 0; i < 100000; i++ {
strs = append(strs, "hello")
newCap := cap(strs)
if currCap != newCap {
fmt.Printf("new cap %v, (new cap) / (old cap) = %v \n", newCap, float32(newCap)/float32(currCap))
currCap = newCap
}
}
fmt.Println()
fmt.Println("--byte---")
var bytes []byte
currCap = 0
for i := 0; i < 100000; i++ {
bytes = append(bytes, 0x00)
newCap := cap(bytes)
if currCap != newCap {
fmt.Printf("new cap %v, (new cap) / (old cap) = %v \n", newCap, float32(newCap)/float32(currCap))
currCap = newCap
}
}
fmt.Println()
fmt.Println("--bool---")
var bools []bool
currCap = 0
for i := 0; i < 100000; i++ {
bools = append(bools, true)
newCap := cap(bools)
if currCap != newCap {
fmt.Printf("new cap %v, (new cap) / (old cap) = %v \n", newCap, float32(newCap)/float32(currCap))
currCap = newCap
}
}
fmt.Println()
fmt.Println("--interface---")
var ifs []interface{}
currCap = 0
for i := 0; i < 100000; i++ {
ifs = append(ifs, true)
newCap := cap(ifs)
if currCap != newCap {
fmt.Printf("new cap %v, (new cap) / (old cap) = %v \n", newCap, float32(newCap)/float32(currCap))
currCap = newCap
}
}
}
実行結果は長いのでここには貼りませんが(ぜひPlayGroundで試してみてください)、実行してみると、
- sliceのelementのtypeによって、1024を超えてからのcapacityの増え方には違いがある
ということもわかります。
さらに、それぞれの結果をよく見比べると、
- sliceのelementのtypeによっては、違うtype同士でもcapacityの増え方が同じものもある
ということもわかります。これは、例えば、boolとbyte、int32とfloat32, int64とfloat64などを見比べるとわかります。
あらためてまとめると、下記のの特徴がわかったので、次項で内部実装を追いかけてそれらの根拠を探ってみましょう。
-
増加率は一定ではない
capacityが1024になるまでは、だいたい2倍くらいで増えていく
1024を超えてから、増加率が低くなる(1.25倍-1.4倍くらいになる) - sliceのelementのtypeによって、capacityの増え方には違いがある(ただし、違うtype同士でも増え方が同じものもある
実際の内部実装
上記について、実際の実装を追いながら確認していきましょう。
runtimeパッケージのgrowslice
という関数を見ていきます。
概要
この関数は、append時にcapacityがなくなった際に、sliceを拡張するために呼ばれます。
IOと挙動の概要はコメントに書いてあります。
// growslice handles slice growth during append.
// It is passed the slice element type, the old slice, and the desired new minimum capacity,
// and it returns a new slice with at least that capacity, with the old data
// copied into it.
func growslice(et *_type, old slice, cap int) slice {
コメントの通り、inputとして、sliceの要素のtype, (拡張前の)slice, 必要なcapを受け取るようです。
そして、要求された数かそれ以上のcapを持った新しいsliceを作って、そこに古いデータをコピーして返してくれるようです。
一点注目する点として、説明にある通り、この関数は、新しいslice
を作って返してくれるようです。
つまり、「検証1」で試した結果では、capacityが増えてもsliceのポインタはそのままでしたが、あくまでポインタがそのままなだけで、slice自体は新しいもので置き換えているようです。
流れ
細かい例外処理を省くと、このgrowslice
は、ざっくり3つの処理に分けられそうです。
-
仮決めのcapacityを設定する
-
仮決めのcapacityから、新しく確保するメモリ、capacityを決定する
-
新しいcapacityに合わせて、新しいunderlying arrayのメモリを確保し、古いunderlying arrayから要素を移動させる。
詳細
それでは、上記の流れに沿って見ていきましょう
1. 仮決めのcapacityを設定する
newcap := old.cap
doublecap := newcap + newcap
if cap > doublecap {
newcap = cap
} else {
if old.cap < 1024 {
newcap = doublecap
} else {
// Check 0 < newcap to detect overflow
// and prevent an infinite loop.
for 0 < newcap && newcap < cap {
newcap += newcap / 4
}
// Set newcap to the requested cap when
// the newcap calculation overflowed.
if newcap <= 0 {
newcap = cap
}
}
}
この部分は、順番に読んでいけば、比較的わかりやすそうです。
順番に見ていくと、仮決めのcapacityの決め方は、
- 必要なcapcityが現状のcapacityの2倍以上だったら、必要とされているcapacityを採用する
- 現状のcapacityが1024未満だったら、現状のcapacityを2倍したものを採用する
- 現状のcapacityが1024以上だったら、現状のcapacityを2倍したものを採用する
- 3のパターンの実行結果で決まった仮決めのcapacityが0以下だったら(コメント曰くoverflowしたとき用?)、必要とされているcapacityを採用する
となります。
この時点で、先程の実際にコードを動かしてわかった、capacityの増加率のおおまかな変化はこの部分に起因しそうです。
一方で、上記のコードだと、増加率は一定になりそうですが、実際にはそうではありません。そして、typeによって、増加率も異なっています。
その点について、後続のコードから理由を探ってみましょう。
2. 仮決めのcapacityから、新しく確保するメモリ、capacityを決定する
それでは、最終的なcapacityの決め方を見て行きましょう。
ここは、少しややこしくなります。
var overflow bool
var lenmem, newlenmem, capmem uintptr
// Specialize for common values of et.size.
// For 1 we don't need any division/multiplication.
// For sys.PtrSize, compiler will optimize division/multiplication into a shift by a constant.
// For powers of 2, use a variable shift.
switch {
case et.size == 1:
lenmem = uintptr(old.len)
newlenmem = uintptr(cap)
capmem = roundupsize(uintptr(newcap))
overflow = uintptr(newcap) > maxAlloc
newcap = int(capmem)
case et.size == sys.PtrSize:
lenmem = uintptr(old.len) * sys.PtrSize
newlenmem = uintptr(cap) * sys.PtrSize
capmem = roundupsize(uintptr(newcap) * sys.PtrSize)
overflow = uintptr(newcap) > maxAlloc/sys.PtrSize
newcap = int(capmem / sys.PtrSize)
case isPowerOfTwo(et.size):
var shift uintptr
if sys.PtrSize == 8 {
// Mask shift for better code generation.
shift = uintptr(sys.Ctz64(uint64(et.size))) & 63
} else {
shift = uintptr(sys.Ctz32(uint32(et.size))) & 31
}
lenmem = uintptr(old.len) << shift
newlenmem = uintptr(cap) << shift
capmem = roundupsize(uintptr(newcap) << shift)
overflow = uintptr(newcap) > (maxAlloc >> shift)
newcap = int(capmem >> shift)
default:
lenmem = uintptr(old.len) * et.size
newlenmem = uintptr(cap) * et.size
capmem, overflow = math.MulUintptr(et.size, uintptr(newcap))
capmem = roundupsize(capmem)
newcap = int(capmem / et.size)
}
まず、ここでは、単純にcapacityを決めるだけでなく、メモリサイズ(capacity, 古い要素を入れるlength, 新しく宣言するlength)も決めています。
(これらは、uintptr
というGoの組み込み型のtypeで表現されています。uintptr
は、ポインタを格納できる整数型です。)
そして、sliceの要素のtypeのサイズに応じて、決め方が少しづつ異なるようです。
細かく見ると、シフトが行われていたりややこしい部分もありますが、やっていることは基本的に同じです。
まず、新しいunderlying arrayのメモリを確保するために、メモリ容量を決めます。
さらに、新しいunderlying arrayに、古いunderlyingarrayからすでに入っている要素をコピーする必要があるので、そのためのメモリ容量(また要素をまだ入れない容量も)決める必要があるので、それぞれ計算しています。
そして、実際に必要なメモリ容量は、要素のtypeのサイズに依存するので、要素のtypeによって分岐して、要素のtypeも使って計算しています。
なので、サイズが1のtype(et.size == 1
)の場合はtypeのサイズは計算に使われていない(byte
やbool
など1byteで表現できるtypeがこれにあたる)一方で、それ以外の場合はサイズが計算に利用されています。
これらを前提として、肝心のcapacityの決め方を見てみましょう。
いずれの場合にも、実際に確保するメモリ容量を決めてから、それをcapとして計算し直しています。
そして、メモリ容量の決め方ですが、roundupsize
という関数を呼び出しています。
こちらの関数も簡単に見てみましょう。
// Returns size of the memory block that mallocgc will allocate if you ask for the size.
func roundupsize(size uintptr) uintptr {
if size < _MaxSmallSize {
if size <= smallSizeMax-8 {
return uintptr(class_to_size[size_to_class8[divRoundUp(size, smallSizeDiv)]])
} else {
return uintptr(class_to_size[size_to_class128[divRoundUp(size-smallSizeMax, largeSizeDiv)]])
}
}
if size+_PageSize < size {
return size
}
return alignUp(size, _PageSize)
}
コメントにあるように、この関数は、実際のメモリブロックの単位に合わせて、確保するメモリ容量の切り上げを行っています。
これは、TCMalloc
というメモリアロケータの仕様に合わせたものです。
細かい説明はここでは割愛しますが、このTCMalloc
は、格納するデータのサイズに応じて、確保するべきメモリの単位(クラスという)を指定しています。そこで、この関数は、その規定に合うように実際に確保するメモリ容量を切り上げて調整しています。
最終的なcapacityの増加率が必ず2倍または1.25倍にならない理由は、この処理に起因するようです。
元のコードに戻ります。
最後に、計算したメモリ容量からcapacityを計算し直しています。
こちらのコードのように、メモリ容量と要素のサイズから、要素の数であるcapacityを計算しています。
newcap = int(capmem / et.size)
これで、以下の特徴の理由がわかったと思います。
- 増加率は一定ではない
- sliceのelementのtypeによって、capacityの増え方には違いがある(ただし、違うtype同士でも増え方が同じものもある)
最終的なcapacityは、sliceの要素のサイズを考慮したメモリ容量に基づいていて、かつメモリ容量がメモリアロケータの仕様に合わせて最適化されるので、上記のような特徴となるということです。
3. 新しいcapacityに合わせて、新しいunderlying arrayのメモリを確保し、古いunderlying arrayから要素を移動させる
すでにcapacityの決まり方はわかりましたが、残りのコードも簡単に確認していきましょう。
こちらは、実際に計算されたメモリ容量などを使って、実際に新しいsliceを作成する処理になります。
var p unsafe.Pointer
if et.ptrdata == 0 {
p = mallocgc(capmem, nil, false)
// The append() that calls growslice is going to overwrite from old.len to cap (which will be the new length).
// Only clear the part that will not be overwritten.
memclrNoHeapPointers(add(p, newlenmem), capmem-newlenmem)
} else {
// Note: can't use rawmem (which avoids zeroing of memory), because then GC can scan uninitialized memory.
p = mallocgc(capmem, et, true)
if lenmem > 0 && writeBarrier.enabled {
// Only shade the pointers in old.array since we know the destination slice p
// only contains nil pointers because it has been cleared during alloc.
bulkBarrierPreWriteSrcOnly(uintptr(p), uintptr(old.array), lenmem-et.size+et.ptrdata)
}
}
memmove(p, old.array, lenmem)
return slice{p, old.len, newcap}
詳細は割愛しますが、TCMalloc
を利用して新しいunderlying arrayのメモリを確保して、最後のmemmove
で古いunderlying arrayをそこに移動させています。
そして、最後に、新しいunderlying arrayへのポインタを持ったsliceを新規に作成して、関数の戻り値として返しています。
まとめ
以上で、sliceのcapacityが足りなくなったときに、内部でどのような処理が行われているか、そして実際にどのようにcapacity数が増加していくかのイメージが掴めたかと思います。
append
が内部で自動でやってくれるので、普段sliceを使っているときは意識しなくてもcapacityは勝手に増えていくわけですが、このように新しくメモリを確保してunderlying arrayを作り直して、sliceを作り直しているのでした。
これらを意識しておくと、sliceを最初に作成するときに、パフォーマンスの観点から、(必要なcapacityの見当がつく時は)はじめからcapacityを用意しておく意義もわかると思います。
参考
Go Slices: usage and internals
Arrays, slices (and strings): The mechanics of 'append'
Go slice ベストプラクティス
The Go Programming Language Specification - Conversions from slice to array pointer
TCMalloc, Google's Customized Memory Allocator for C and C++, Now Open Source
Discussion