PProf启用

PProf特性的启用会对程序性能产生一定影响,具体影响程度需要根据当前业务场景在PProd启用前后进行对比。

我们来看一个简单的例子:

这个例子使用了s.EnablePProf()启用了性能分析,默认会自动注册以下几个路由规则:

  1. /debug/pprof/*action
  2. /debug/pprof/cmdline
  3. /debug/pprof/profile
  4. /debug/pprof/symbol
  5. /debug/pprof/trace

其中/debug/pprof/*action为页面访问的路由,其他几个地址为go tool pprof命令准备的。

也可以使用StartPProfServer方法,快速开启一个独立的PProf Server,常用于一些没有HTTP Server的常驻的进程中(例如定时任务、GRPC服务中),可以快速开启一个PProf Server用于程序性能分析。该方法的定义如下:

一般的场景是使用异步goroutine运行该PProd Server,即往往是这么来使用:

  1. package main
  2. "github.com/gogf/gf/v2/net/ghttp"
  3. func main() {
  4. go ghttp.StartPProfServer(8199)
  5. // 其他服务启动、运行
  6. // ...
  7. }

PProf指标

  • heap: 报告内存分配样本;用于监视当前和历史内存使用情况,并检查内存泄漏。
  • threadcreate: 报告了导致创建新OS线程的程序部分。
  • goroutine: 报告所有当前goroutine的堆栈跟踪。
  • block: 显示goroutine在哪里阻塞同步原语(包括计时器通道)的等待。默认情况下未启用,需要手动调用runtime.SetBlockProfileRate启用。
  • mutex: 报告锁竞争。默认情况下未启用,需要手动调用runtime.SetMutexProfileFraction启用。

PProf页面

简单的性能分析我们直接访问/debug/pprof地址即可,内容如下:

1、pprof页面

2、堆使用量

PProf服务性能分析 - 图2

3、当前进程中的goroutine详情

性能采集分析

如果想要进行详细的性能分析,基本上离不开go tool pprof命令行工具的支持,在开启性能分析支持后,我们可以使用以下命令执行性能采集分析:

  1. go tool pprof "http://127.0.0.1:8199/debug/pprof/profile"

执行后pprof工具经过约30秒左右的接口信息采集(这30秒期间WebServer应当有流量进入,我们这里不停地访问hello world页面以作测试),然后生成性能分析报告,随后可以通过top10/web等pprof命令查看报告结果,更多命令可使用go tool pprof查看。关于的详细使用介绍,请查看Golang官方:blog.golang.org/profiling-go-programs

本示例中的命令行性能分析结果如下:

其中web命令用以图形展示接口之间的调用关系以及性能情况,但是需要安装Graphviz图形化工具,以我目前的系统为Ubuntu为例,直接执行sudo apt-get install graphviz命令即可安装完成图形化工具(如果是MacOS,使用brew install Graphviz安装),随后再次使用web命令,最终生成以下图表:

与CPU性能分析类似,内存使用分析同样使用到go tool pprof命令:

  1. $ go tool pprof http://127.0.0.1:8299/debug/pprof/heap
  2. Fetching profile over HTTP from http://127.0.0.1:8299/debug/pprof/heap
  3. Saved profile in /Users/john/pprof/pprof.alloc_objects.alloc_space.inuse_objects.inuse_space.004.pb.gz
  4. Type: inuse_space
  5. Entering interactive mode (type "help" for commands, "o" for options)
  6. (pprof) top
  7. Showing nodes accounting for 1536.39kB, 100% of 1536.39kB total
  8. Showing top 10 nodes out of 19
  9. flat flat% sum% cum cum%
  10. 512.19kB 33.34% 33.34% 512.19kB 33.34% runtime.malg
  11. 512.14kB 33.33% 66.67% 512.14kB 33.33% github.com/gogf/gf/v2/container/gmap.(*StrAnyMap).doSetWithLockCheck
  12. 512.06kB 33.33% 100% 512.06kB 33.33% net.newFD (inline)
  13. 0 0% 100% 512.14kB 33.33% github.com/gogf/gf/v2/container/gmap.(*StrAnyMap).GetOrSetFuncLock
  14. 0 0% 100% 512.06kB 33.33% github.com/gogf/gf/v2/net/ghttp.(*Server).startServer.func1
  15. 0 0% 100% 512.06kB 33.33% github.com/gogf/gf/v2/net/ghttp.(*gracefulServer).ListenAndServe
  16. 0 0% 100% 512.06kB 33.33% github.com/gogf/gf/v2/net/ghttp.(*gracefulServer).doServe
  17. 0 0% 100% 512.14kB 33.33% github.com/gogf/gf/v2/os/gres.Instance
  18. 0 0% 100% 512.14kB 33.33% github.com/gogf/gf/v2/os/gres.init
  19. 0 0% 100% 512.06kB 33.33% net.(*TCPListener).Accept
  20. (pprof) web

PProf服务性能分析 - 图5