Go技巧101
代码包的开发者可以在一个结构体类型定义里放置一个非导出的零尺寸的字段,这样编译器将会禁止代码包的使用者使用含有一些字段但却不含有字段名字的组合字面量来创建此结构体类型的值。
例如:
// main.go
package main
import "foo"
func main() {
//_ = foo.Config{[0]int{}, "bar", 123} // 编译不通过
_ = foo.Config{Name: "bar", Size: 123} // 编译没问题
}
请尽量不要把零尺寸的非导出字段用做结构体的最后一个字段,因为而导致一些内存浪费。
如何使一个结构体类型不可比较?
有时候,我们想要避免一个自定义的结构体类型被用做一个映射的键值类型,那么我们可以放置一个非导出的零尺寸的不可比较类型的字段在结构体类型中以使此结构体类型不可比较。 例如:
package main
type T struct {
dummy [0]func()
AnotherField int
}
var x map[T]int // 编译错误:非法的键值类型
func main() {
var a, b T
_ = a == b // 编译错误:非法的比较
}
不要使用其中涉及到的表达式之间会相互干涉的赋值语句。
目前(Go 1.17),在一些多值赋值中有一些表达式估值顺序是未指定的。 因此,如果一个多值赋值语句中涉及的表达式会相互干涉,或者不太容易确定是否会相互干涉,我们应该将此多值赋值语句分拆成多个单值赋值语句。
事实上,在一些写得很糟糕的代码中,单值赋值中的表达式求值顺序也有可能是有歧义的。 例如,下面的程序可能会打印[7 0 9]
、[0 8 9]
或者[7 8 9]
,依赖于具体编译器实现。
package main
import "fmt"
var a = &[]int{1, 2, 3}
var i int
func f() int {
i = 1
a = &[]int{7, 8, 9}
return 0
}
func main() {
// 表达式"a"、"i"和"f()"的估值顺序未定义。
(*a)[i] = f()
fmt.Println(*a)
}
换言之,一条赋值语句中的某个函数调用表达式的估值有可能会影响到其它非函数调用表达式的估值结果。 请阅读以获取更多细节。
如何模拟一些其它语言中支持的for i in 0..N
循环代码块?
我们可以通过遍历一个元素尺寸为零的数组或者一个空数组指针来模拟这样的循环。 例如:
package main
import "fmt"
func main() {
const N = 5
for i := range [N]struct{}{} {
fmt.Println(i)
}
for i := range [N][0]int{} {
fmt.Println(i)
for i := range (*[N]int)(nil) {
fmt.Println(i)
}
}
当我们废弃一个仍在使用的切片中的一些元素时,我们应该重置这些元素中的指针来避免暂时性的内存泄漏。
关于细节,请阅读如何删除切片元素和。
一些标准包中的某些类型的值不期望被复制。
bytes.Buffer
类型、strings.Builder
类型以及在sync
标准库包里的类型的值不推荐被复制。 (它们确实不应该被复制,尽管在某些特定情形下复制它们或许是没有问题的。)
strings.Builder
的实现会在运行时刻探测到非法的strings.Builder
值复制。 一旦这样的复制被发现,就会产生恐慌。例如:
package main
import "strings"
func main() {
var b strings.Builder
b.WriteString("hello ")
b2.WriteString("world!") // 一个恐慌将在这里产生
}
复制标准库包sync
中类型的值会被Go官方工具链提供的go vet
命令检测到并被警告。
// demo.go
package demo
import "sync"
func f(m sync.Mutex) { // warning: f passes lock by value: sync.Mutex
m.Lock()
defer m.Unlock()
// do something ...
}
复制bytes.Buffer
的值不会在运行时被检查到,也不会被go vet
命令所检测到。 千万要小心不要随意这样做。
如何在不导入reflect
标准库包的情况下检查一个值是否拥有某个方法。
可以使用下面的例子中的方法。 (假设需要被检查的方法的原型是M(int) string
。)
package main
import "fmt"
type A int
type B int
func (b B) M(x int) string {
return fmt.Sprint(b, ": ", x)
}
func check(v interface{}) bool {
_, has := v.(interface{M(int) string})
return has
}
func main() {
var a A = 123
var b B = 789
fmt.Println(check(a)) // false
fmt.Println(check(b)) // true
}
如何高效且完美地克隆一个切片?
关于细节请阅读这篇wiki文章和。
在部分场景下我们应该使用三下标子切片形式。
假设一个包提供了一个func NewX(...Option) *X
函数,并且这个函数的实现将输入选项与一些内部默认选项合并,那么下面的实现是不推荐的。
func NewX(opts ...Option) *X {
options := append(opts, defaultOpts...)
// 使用合并后选项来创建一个X值并返回其指针。
// ...
}
上述实现不被推荐的原因是append
函数调用可能会修改输入实参opts
的底层潜在Option
元素序列。 对大多数场景,这可能是没问题的。但是对某些特殊场景,这有可能会导致后续代码执行产生不期望的结果。
为了避免输入实参的底层Option
元素序列被修改,我们应该使用下面的实现方法:
func NewX(opts ...Option) *X {
// 改用三下标子切片格式。
opts = append(opts[:len(opts):len(opts)], defaultOpts...)
// 使用合并后选项来创建一个X值并返回其指针。
// ...
}
另一方面,对于NewX
函数的调用者来说,不应该依赖于此函数的具体实现,所以最好使用三下标子切片形式options[:len(options):cap(options)]
来传递实参。
另外一个需要使用三下标子切片格式的场景在中被提及。
三下标子切片格式的一个缺点是它们有些冗长。 事实上,我曾经提了一个建议来让三下标格式看上起简洁得多。 但是此建议被否决了。
使用匿名函数来使部分延迟函数调用尽早执行。
关于细节,请阅读这篇文章。
确保并表明一个自定义类型实现了指定的接口类型。
我们可以将一个自定义类型的一个值赋给指定接口类型的一个变量来确保此自定义类型实现了指定接口类型。 更重要的是,这样可以表明此自定义类型实现了指定接口类型。 使用自解释的代码编写文档比使用注释来编写文档要自然得多。
package myreader
import "io"
type MyReader uint16
func NewMyReader() *MyReader {
var mr MyReader
return &mr
}
func (mr *MyReader) Read(data []byte) (int, error) {
switch len(data) {
*mr = MyReader(data[0]) << 8 | MyReader(data[1])
return 2, nil
*mr = MyReader(data[0]) << 8 | MyReader(data[1])
case 1:
*mr = MyReader(data[0])
case 0:
}
return len(data), io.EOF
}
// 下面三行中的任一行都可以保证类型*MyReader实现
// 了接口io.Reader。
var _ io.Reader = NewMyReader()
var _ io.Reader = (*MyReader)(nil)
func _() {_ = io.Reader(nil).(*MyReader)}
除了上一个技巧中提到过的编译时刻断言技巧,下面将要介绍更多编译时刻断言技巧。
下面是一些方法用来在编译时刻保证常量N
不小于另一个常量M
:
// 下面任一行均可保证N >= M
func _(x []int) {_ = x[N-M]}
func _(){_ = []int{N-M: 0}}
func _([N-M]int){}
var _ [N-M]int
const _ uint = N-M
type _ [N-M]int
// 如果M和N都是正整数常量,则我们也可以使用下一行所示的方法。
var _ uint = N/M - 1
另一个方法是借鉴的一个点子。 此点子利用了容器组合字面量中不能出现重复的常量键值这一规则。
var _ = map[bool]struct{}{false: struct{}{}, N>=M: struct{}{}}
类似地,下面是断言两个整数常量相等的方法:
var _ [N-M]int; var _ [M-N]int
type _ [N-M]int; type _ [M-N]int
const _, _ uint = N-M, M-N
func _([N-M]int, [M-N]int) {}
var _ = map[bool]int{false: 0, M==N: 1}
var _ = [1]int{M-N: 0} // 唯一被允许的元素索引下标为0
var _ = [1]int{}[M-N] // 唯一被允许的元素索引下标为0
var _ [N-M]int = [M-N]int{}
最后一行的灵感同样来自于Luke Champine的一条tweet。
下面是一些用来断言一个常量字符串是不是一个空串的方法。
type _ [len(aStringConstant)-1]int
var _ = map[bool]int{false: 0, aStringConstant != "": 1}
var _ = aStringConstant[:1]
var _ = aStringConstant[0]
const _ = 1/len(aStringConstant)
最后一行借鉴自Jan Mercl的一个。
有时候,为了避免包级变量消耗太多的内存,我们可以把断言代码放在一个名为空标识符的函数体中。 例如:
func _() {
var _ = map[bool]int{false: 0, N>=M: 1}
var _ [N-M]int
}
如何声明一个最大的int和uint常量?
const MaxUint = ^uint(0)
const MaxInt = int(^uint(0) >> 1)
如何在编译时刻决定系统原生字的尺寸?
这个技巧和Go无关。
const Is64bitArch = ^uint(0) >> 63 == 1
const Is32bitArch = ^uint(0) >> 63 == 0
const WordBits = 32 << (^uint(0) >> 63) // 64或32
如何保证64位原子函数调用中操作的64位整数的地址在32位架构上总是64位对齐的?
关于细节,请阅读一文。
尽量避免将大尺寸的值包裹在接口值中。
当一个非接口值被赋值给一个接口值时,此非接口值的一个副本将被包裹到此接口值中。 副本复制的开销和非接口值的尺寸成正比。尺寸越大,复制开销越大。 所以请尽量避免将大尺寸的值包裹到接口值中。
在下面的例子中,后两个打印调用的成本要比前两个低得多。
package main
import "fmt"
func main() {
var a [1000]int
// 这两行的开销相对较大,因为数组a中的元素都将被复制。
fmt.Println(a)
fmt.Printf("Type of a: %T\n", a)
// 这两行的开销较小,数组a中的元素没有被复制。
fmt.Printf("%v\n", a[:])
fmt.Println("Type of a:", fmt.Sprintf("%T", &a)[1:])
}
关于不同种类的类型的尺寸,请阅读一文。
利用BCE(边界检查消除)进行性能优化。
请阅读来获知什么是边界检查消除(BCE)以及目前的标准编译器对BCE的支持程度。
下面是一个利用了BCE进行性能优化的例子:
从下面所示的基准测试结果来看,函数NumSameBytes_2
比函数NumSameBytes_1
效率更高。
BenchmarkNumSameBytes_1-4 10000000 669 ns/op
BenchmarkNumSameBytes_2-4 20000000 450 ns/op