Go语言内存逃逸之谜

开发 后端 存储软件
所谓逃逸分析就是在编译阶段由编译器根据变量的类型、外部使用情况等因素来判定是分配到堆还是栈,从而替代人工处理。

[[402433]]

本文转载自微信公众号「后端技术指南针」,作者大白。转载本文请联系后端技术指南针公众号。

我们在高中学过一些天体物理的知识,比如常见的三个宇宙速度:

  • 第一宇宙速度:航天器逃离地面围绕地球做圆周运动的最小速度:7.9km/s
  • 第二宇宙速度:航天器逃离地球的最小速度:11.18km/s
  • 第三宇宙速度:航天器逃离太阳系的最小速度:16.64km/s

了解了航天器的逃逸行为,我们今天来点特别的:内存逃逸。

通过本文你将了解到以下内容:

  • C/C++的内存布局和堆栈
  • Go的内存逃逸和逃逸分析
  • 内存逃逸的小结

Part1C/C++的内存布局和堆栈

这应该是一道出现频率极高的面试题。

C/C++作为静态强类型语言,编译成二进制文件后,运行时整个程序的内存空间分为:

  • 内核空间 Kernel Space
  • 用户空间 User Space

内核空间主要存放进程运行时的一些控制信息,用户空间则是存放程序本身的一些信息,我们来看下用户空间的布局:

堆和栈的主要特点:

  • 栈区(Stack):由编译器自动分配释放,存储函数的参数值,局部变量值等,但是空间一般较小数KB~数MB
  • 堆区(Heap):C/C++没有GC机制,堆内存一般由程序员申请和释放,空间较大,能否用好取决于使用者的水平

Go语言与C语言渊源极深,C语言面临的问题,Go同样会面对,比如:变量的内存分配问题。

  • 在C语言中,需要程序员自己根据需要来确定采用堆还是栈,栈内存由OS全权负责,但是堆内存需要显式调用malloc/new等函数申请,并且对应调用free/delete来释放。
  • Go语言具有垃圾回收Garbage Collection机制来进行堆内存管理,并且没有像malloc/new这种堆内存分配的关键字。
  • 栈内存的分配和释放开销非常小,堆内存对于Go来说开销比栈内存大很多。

Part2Go的内存逃逸和逃逸分析

如果写过C/C++都会知道,在函数内部声明局部变量,然后返回其指针,如果外部调用则会报错:

  1. #include <iostream> 
  2. using namespace std; 
  3.  
  4. int* getValue() 
  5.  int val = 10086; 
  6.  return &val; 
  7.  
  8. int main() 
  9.    cout<<*getValue()<<endl; 
  10.    return 0; 

编译上述代码:main.cpp: In function ‘int* getValue()’: main.cpp:7:9: warning: address of local variable ‘val’ returned [-Wreturn-local-addr]

用同样的思想,写一个go版本的代码:

  1. package main 
  2.  
  3. import ( 
  4.  "fmt" 
  5.  
  6. func main() { 
  7.     str := GetString() 
  8.     fmt.Println(*str) 
  9.  
  10. func GetString() *string { 
  11.     var s string 
  12.     s = "hello world" 
  13.     return &s 

代码却可以正常运行,我们本意是在栈上分配一个变量,用完就销毁,但是外部却调用了,甚至可以正常进行,表现和C++完全不同。

其实,这就是Go的内存逃逸现象,Go模糊了栈内存和堆内存的界限,具体来说变量究竟分配到哪里,是由编译器来决定的。

1逃逸分析escape analysis

所谓逃逸分析就是在编译阶段由编译器根据变量的类型、外部使用情况等因素来判定是分配到堆还是栈,从而替代人工处理。

一般将局部变量和参数分配到栈上,但是并不绝对:

  • 如果编译器不能确定在函数返回时,变量是否被使用则分配到堆上
  • 如果局部变量非常大,也会分配到堆上
  • ......

编译器不清楚局部变量是否会被外部使用时,就会倾向于分配到堆上。

Go编译器在确定函数返回后不会再被引用时才分配到栈上,其他情况下都是分配到堆上。

这样做虽然浪费堆空间,但是有效避免了悬挂指针的出现,并且由于GC的存在也不会出现内存泄漏,权衡之下也是一种合理的做法。

2哪些情况会出现内存逃逸

对于Go来说,在日常使用中有几种常见的做法会导致内存逃逸现象的出现:

  • 指针逃逸
  • 栈空间不足逃逸
  • map/slice/interface/channel的使用
  • ......

指针逃逸

在上一个例子中我们使用一个int指针来说明内存逃逸的现象,接下来我们扩展一下变为结构体指针,并且使用gcflags来给编译器传特定参数来观察逃逸现象:

  1. // test.go 
  2. package main 
  3.  
  4. import "fmt" 
  5.  
  6. type Escape struct { 
  7.  who string 
  8.  
  9. func CallInstance(caller string) (*Escape) { 
  10.  instance := new(Escape
  11.  instance.who = caller 
  12.  return instance 
  13.  
  14. func main() { 
  15.  outer := CallInstance("hello world"
  16.  fmt.Println(outer.who) 

执行:go build -gcflags=-m test.go 如下:

  1. # command-line-arguments 
  2. ./test.go:9:6: can inline CallInstance 
  3. ./test.go:16:23: inlining call to CallInstance 
  4. ./test.go:17:13: inlining call to fmt.Println 
  5. ./test.go:9:19: leaking param: caller 
  6. ./test.go:10:17: new(Escape) escapes to heap 
  7. ./test.go:16:23: main new(Escape) does not escape 
  8. ./test.go:17:19: outer.who escapes to heap 
  9. ./test.go:17:13: main []interface {} literal does not escape 
  10. ./test.go:17:13: io.Writer(os.Stdout) escapes to heap 
  11. <autogenerated>:1: (*File).close .this does not escape 

我们可以看到"escapes to heap",确实出现了内存逃逸,本该在栈上逃逸到堆上了。

栈空间不足逃逸

对于64bit的Linux系统而言栈的大小一般是8MB,Go中每个goroutine初始化栈大小是2KB,在goroutine的运行过程中栈的大小可能会变化,但也不会超过OS对线程栈大小的限制。

在网上找了个例子,用mac跑了一下:

  1. package main 
  2.  
  3. import "math/rand" 
  4.  
  5. func generate8191() { 
  6.  nums := make([]int, 8191) // < 64KB 
  7.  for i := 0; i < 8191; i++ { 
  8.   nums[i] = rand.Int() 
  9.  } 
  10.  
  11. func generate8192() { 
  12.  nums := make([]int, 8192) // = 64KB 
  13.  for i := 0; i < 8192; i++ { 
  14.   nums[i] = rand.Int() 
  15.  } 
  16.  
  17. func generate(n int) { 
  18.  nums := make([]int, n) // 不确定大小 
  19.  for i := 0; i < n; i++ { 
  20.   nums[i] = rand.Int() 
  21.  } 
  22.  
  23. func main() { 
  24.     generate8191() 
  25.     generate8192() 
  26.     generate(1) 
  1. # command-line-arguments 
  2. ./test_3.go:6:14: generate8191 make([]int, 8191) does not escape 
  3. ./test_3.go:13:14: make([]int, 8192) escapes to heap 
  4. ./test_3.go:20:14: make([]int, n) escapes to heap 

可以看到在分配8191个大小时未发生逃逸,在分配8192时发生了逃逸,不定长度也发生了逃逸。

其他情况

在go中map、interface、slice、interface是非常常见的数据结构,也是非常容易触发内存逃逸的根源。

  • 向channel中发送指针或者带指针的值,因为在编译时没有办法知道哪个goroutine会在channel上接收数据。所以编译器没法知道变量什么时候才会被释放。
  • slice中指针或带指针的值,这会导致切片的内容逃逸,尽管其后面的数组可能是在栈上分配的,但其引用的值一定是在堆上。
  • slice数组扩容也可能导致内存逃逸,如果切片背后的存储要基于运行时的数据进行扩充,就会在堆上分配。
  • interface类型可以代表任意类型,编译器不知道参数会是什么类型,只有运行时才知道,因此只能分配到堆上。

Part3内存逃逸小结

我们该如何评价内存逃逸呢?

  • Go语言对用户来说模糊了堆内存和栈内存的分配,编译器借助于逃逸分析来实现特定场景的内存逃逸。
  • 任何事情都是两面性,Go语言借助于内存逃逸和GC机制解放了程序员,但是同时也带来了性能问题,因为堆内存的分配和释放都是需要成本的。
  • Go的编译器在很多时候无法确定该如何分配内存,因此只能采用一种稳妥但有失性能的做法,分配到堆上。
  • 意识里指针传递比值传递更高效,但是在Go中并非如此,如果指针传递出现内存逃逸将内存分配到堆上后续就有会GC操作,消耗比值传递更大。
  • 如果明确不需要外部使用,就需要尽量避免内存逃逸,不要一味完全依赖编译器本身。

 

责任编辑:武晓燕 来源: 后端技术指南针
相关推荐

2022-07-25 15:38:59

Go 语言Go 语言编译器内存逃逸

2023-01-10 09:18:37

Go内存分配逃逸

2023-01-28 08:32:04

Go内存分配

2022-07-10 23:15:46

Go语言内存

2022-11-30 08:19:15

内存分配Go逃逸分析

2017-03-17 09:31:40

2021-01-06 09:47:51

内存Go语言

2023-11-21 15:46:13

Go内存泄漏

2017-10-23 14:08:37

2018-03-12 22:13:46

GO语言编程软件

2022-11-08 11:26:13

Go逃逸代码

2010-03-15 16:06:52

2014-01-14 09:10:53

GoHTTP内存泄漏

2021-12-28 17:39:05

Go精度Json

2023-12-22 07:55:38

Go语言分配策略

2021-08-02 07:57:02

内存Go语言

2011-07-06 12:04:53

架构

2017-10-27 14:32:53

内存存储暴涨

2012-10-08 09:25:59

GoGo语言开发语言

2020-07-21 14:19:18

JVM编程语言
点赞
收藏

51CTO技术栈公众号