Go类型系统概述

    内置基本类型已经在前面的文章一文中介绍过了。 为了本文的完整性,这些内置类型重新被列在这里:

    • 内置字符串类型:.
    • 内置布尔类型:bool.
    • 内置数值类型:
      • int8uint8byte)、int16uint16int32rune)、uint32int64uint64intuintuintptr
      • float32float64
      • complex64complex128

    注意,byteuint8的一个内置别名,runeint32的一个内置别名。 下面将要提到如何声明自定义的类型别名。

    除了字符串类型,《Go语言101》后续其它文章将不再对其它基本类型做详细讲解。

    概念:组合类型(composite type)

    Go支持下列组合类型:

    • 指针类型 - 类C指针
    • - 类C结构体
    • 函数类型 - 函数类型在Go中是一种一等公民类别
    • ,包括:
      • 数组类型 - 定长容器类型
      • 映射类型(map)- 也常称为字典类型。在标准编译器中映射是使用哈希表实现的。
    • 通道类型 - 通道用来同步并发的协程
    • - 接口在反射和多态中发挥着重要角色

    非定义组合类型可以用它们各自的字面表示形式来表示。 下面是一些各种不同种类的非定义组合类型字面表示形式的例子(非定义类型将在下面解释):

    支持和不支持比较的类型将在下面介绍。

    事实:类型的种类

    每种上面提到的基本类型和组合类型都对应着一个类型种类(kind)。除了这些种类,今后将要介绍的非类型安全指针类型属于另外一个新的类型种类。

    所以,目前(Go 1.17),Go有26个类型种类。

    语法:类型定义(type definition declaration)

    类型定义又称类型定义声明。在Go 1.9之前,类型定义被称为类型声明并且是唯一的一种类型声明形式。 但是自从Go 1.9,类型定义变成了两种类型声明形式之一。另一种新的类型声明形式为下一节将要介绍的类型别名声明。)

    在Go中,我们可以用如下形式来定义新的类型。在此语法中,type为一个关键字。

    1. // 定义单个类型。
    2. type NewTypeName SourceType
    3. // 定义多个类型。
    4. type (
    5. NewTypeName1 SourceType1
    6. NewTypeName2 SourceType2
    7. )

    新的类型名必须为标识符。但是请注意:包级类型(以及下一节将要介绍的类型别名)的名称不能为。

    上例中的第二个类型声明中包含两个类型描述(type specification)。 如果一个类型声明包含多于一个的类型描述,这些类型描述必须用一对小括号()括起来。

    注意:

    • 一个新定义的类型和它的源类型为两个不同的类型。
    • 在两个不同的类型定义中的定义的两个类型肯定为两个不同的类型。
    • 一个新定义的类型和它的源类型的底层类型(将在下面介绍)一致并且它们的值可以相互显式转换。
    • 类型定义可以出现在函数体内。

    一些类型定义的例子:

    语法:类型别名声明(type alias declaration)

    类型别名声明是一种在Go 1.9中新增的类型声明形式。)

    上面已经提到了,Go中有两个内置类型别名:byte(类型uint8的别名)和rune(类型int32的别名)。 在Go 1.9之前,它们是Go中仅有的两个类型别名。

    从Go 1.9开始,我们可以使用下面的语法来声明自定义类型别名。此语法和类型定义类似,但是请注意每个类型描述中多了一个等号=

    1. type (
    2. Name = string
    3. Age = int
    4. )
    5. type table = map[string]int

    类型别名也必须为标识符。同样地,类型别名可以被声明在函数体内。

    在上面的类型别名声明的例子中,Name是内置类型string的一个别名,它们表示同一个类型。 同样的关系对下面的几对类型表示也成立:

    • 别名Age和内置类型int
    • 别名table和映射类型map[string]int
    • 别名Table和映射类型map[Name]Age

    事实上,文字表示形式map[string]intmap[Name]Age也表示同一类型。 所以,tableTable一样表示同一个类型。

    注意,尽管两个别名tableTable表示同一个类型,但Table是导出的,所以它可以被其它包引入使用,而table却不可以。

    类型别名声明在重构一些大的Go项目等场合很有用。 在通常编程中,类型定义声明使用得更广泛。

    概念:定义类型和非定义类型(defined type and undefined type)

    一个定义类型是一个在某个类型定义声明中定义的类型。

    在下面的例子中,别名C和类型字面表示[]string都表示同一个非定义类型。 类型A和别名B均表示同一个定义类型。

    概念:有名类型和无名类型(named type and unnamed type)

    在Go 1.9之前,有名类型这一术语准确地定义在Go白皮本中。它曾被定义为一个有名字的类型。 随着Go 1.9中引入的类型别名新特性,此术语被从白皮书中删除了,原因是它可能会造成一些理解上的困惑。 比如,一些类型字面表示(比如上一节出现中的别名C)是一个标识符(即一个名称),但是它们所表示的类型(比如[]string)在Go 1.9之前却被称为无名类型。

    为了避免出现这样的困惑,从Go 1.9开始,一个新的术语定义类型被引入来填补移除有名类型后的空白。 然而此举也给一些概念解释造成了障碍,或者形成了一些。 为了避免这些尴尬的局面和解释上的障碍,Go语言101中的文章将遵守如下原则:

    • 一个类型别名将不会被称为一个类型,尽管我们常说它表示着一个类型。
    • 术语有名类型定义类型将被视为完全相同的概念。(同样地,无名类型非定义类型亦为同一概念。) 换句话说,当提到“一个类型别名T是一个有名类型”,其实际意义是类型别名T表示着一个有名类型。 如果T表示着一个无名类型,则我们不应该说T是一个有名类型,即使别名T它本身拥有一个名字。
    • 当我们提及一个类型名(称),它可能是一个定义类型的名称,也可能是一个类型别名的名称。

    概念:底层类型(underlying type)

    在Go中,每个类型都有一个底层类型。规则:

    • 一个内置类型的底层类型为它自己。
    • unsafe标准库包中定义的Pointer类型的底层类型是它自己。(至少我们可以认为是这样。事实上,关于unsafe.Pointer类型的底层类型,官方文档中并没有清晰的说明。我们也可以认为unsafe.Pointer类型的底层类型为*T,其中T表示一个任意类型。)
    • 一个非定义类型(必为一个组合类型)的底层类型为它自己。
    • 在一个类型声明中,新声明的类型和源类型共享底层类型。

    一个例子:

    1. // 这四个类型的底层类型均为内置类型int。
    2. type (
    3. MyInt int
    4. )
    5. // 下面这三个新声明的类型的底层类型各不相同。
    6. type (
    7. IntSlice []int // 底层类型为[]int
    8. MyIntSlice []MyInt // 底层类型为[]MyInt
    9. )
    10. // 类型[]Age、Ages和AgeSlice的底层类型均为[]Age。
    11. type Ages AgeSlice

    如何溯源一个声明的类型的底层类型?规则很简单,在溯源过程中,当遇到一个内置类型或者非定义类型时,溯源结束。 以上面这几个声明的类型为例,下面是它们的底层类型的溯源过程:

    在Go中,

    • 底层类型为内置类型bool的类型称为布尔类型
    • 底层类型为任一内置整数类型的类型称为整数类型
    • 底层类型为内置类型float32或者float64的类型称为浮点数类型
    • 底层类型为内置类型complex64complex128的类型称为复数类型
    • 整数类型、浮点数类型和复数类型统称为数字值类型
    • 底层类型为内置类型string的类型称为字符串类型

    底层类型这个概念在中扮演着重要角色。

    一个类型的一个实例称为此类型的一个值。一个类型可以有很多不同的值,其中一个为它的零值。 同一类型的不同值共享很多相同的属性。

    每个类型有一个零值。一个类型的零值可以看作是此类型的默认值。 预声明的标识符nil可以看作是切片、映射、函数、通道、指针(包括非类型安全指针)和接口类型的零值的字面量表示。 我们以后可以在一文中了解到关于nil的各种事实。

    在源代码中,值可以呈现为若干种形式,包括字面量、、变量和。前三种形式可以看作是最后一种形式的特例。

    值分为类型确定的和类型不确定的

    基本类型和它们的字面量表示已经在中介绍过了。 另外,Go中还有另外两种的字面量表示形式:函数字面量表示形式和组合字面量表示形式(composite literal)。

    函数字面量表示形式用来表示函数值。事实上,一个函数声明是由一个标识符(函数名)和一个函数字面量表示形式组成。

    组合字面量表示形式用来表示结构体类型值和容器类型(数组、切片和映射)值。 详见和容器类型两文。

    指针类型、通道类型和接口类型的值没有字面量表示形式。

    概念:值部(value part)

    在运行时刻,很多值是存储在内存的。每个这样的值都有一个直接部分,但是有一些值还可能有一个或多个间接部分。每个值部分在内存中都占据一段连续空间。 通过安全或者指针,一个值的间接部分被此值的直接部分所引用。

    值部这个术语并没有在Go白皮书中定义。它仅使用在《Go语言101》这本书中,用来简化一些解释并帮助Go程序员更好地理解Go类型和值。

    概念:值尺寸(value size)

    一个值存储在内存中是要占据一定的空间的。此空间的大小称为此值的尺寸。值尺寸是用字节数来衡量的。 在Go中,当我们谈及一个值的尺寸,如果没有特殊说明,我们一般是指此值的直接部分的尺寸。 某个特定类别的所有类型的值的尺寸都是一样的。因为这个原因,我们也常将一个值的尺寸说成是它的类型的尺寸(或值尺寸)。

    我们可以用unsafe标准库包中的Sizeof函数来取得任何一个值的尺寸。

    Go白皮书没有规定非数值类型值的尺寸。对数值类型值的尺寸的要求已经在基本类型和它们的字面量表示一文中提及了。

    概念:指针类型的基类型(base type)

    如果一个指针类型的底层类型表示为*T,则此指针类型的基类型为T所表示的类型。

    指针类一文详细解释了指针类类型和指针值。

    概念:结构体类型的字段(field)

    1. struct {
    2. author string
    3. title string
    4. pages int
    5. }

    结构体一文详细解释了结构体类型和结构体值。

    概念:函数类型的签名(signature)

    一个函数和其类型的签名由此函数的输入参数和返回结果的类型列表组成。 函数名称和函数体不属于函数签名的构成部分。

    函数一文详细解释了函数类型和函数值。

    概念:类型的方法(method)和方法集(method set)

    在Go中,我们可以给满足某些条件的类型声明方法。方法也常被称为成员函数。 一个类型的所有方法组成了此类型的方法集。

    概念:接口类型的动态类型和动态值

    接口类型的值称为接口值。一个接口值可以包裹装载一个非接口值。包裹在一个接口值中的非接口值称为此接口值的动态值。此动态值的类型称为此接口值的动态类型。 一个什么也没包裹的接口值为一个零值接口值。零值接口值的动态值和动态类型均为不存在。

    一个接口类型可以指定若干个(可以是零个)方法,这些方法形成了此接口类型的方法集。

    如果一个类型(可以是接口或者非接口类型)的方法集是一个接口类型的方法集的超集,则我们说此类型实现了此接口类型。

    一文详细解释了接口类型和接口值。

    对于一个(类型确定的)非接口值,它的具体类型就是它的类型,它的具体值就是它自己。

    一个零值接口值没有具体类型和具体值。 对于一个非零值接口值,它的具体类型和具体值就是它的动态类型和动态值。

    概念:容器类型

    数组、切片和映射是Go中的三种正式意义上的内置容器类型。

    有时候,字符串和通道类型也可以被非正式地看作是容器类型。

    (正式和非正式的)容器类型的每个值都有一个长度属性。

    数组、切片和映射一文详细解释了各种正式容器类型和它们的值。

    概念:映射类型的键值(key)类型

    如果一个映射类型的底层类型表示为map[Tkey]T,则此映射类型的键值类型为TkeyTkey必须为一个可比较类型(见下)。

    概念:容器类型的元素(element)类型

    存储在一个容器值中的所有元素的类型必须为同一个类型。此同一类型称为此容器值的(容器)类型的元素类型。

    • 如果一个数组类型的底层类型表示为[N]T,则此数组类型的元素类型为T所表示的类型。
    • 如果一个切片类型的底层类型表示为[]T,则此切片类型的元素类型为T所表示的类型。
    • 如果一个映射类型的底层类型表示为map[Tkey]T,则此映射类型的元素类型为T所表示的类型。
    • 如果一个通道类型的底层类型表示为chan Tchan<- T或者<-chan T,则此通道类型的元素类型为T所表示的类型。
    • 一个字符串类型的元素类型总是内置类型byte(亦即uint8)。

    概念:通道类型的方向

    一个通道值可以被看作是先入先出(first-in-first-out,FIFO)队列。一个通道值可能是可读可写的、只读的(receive-only)或者只写的(send-only)。

    • 一个可读可写的通道值也称为一个双向通道。 一个双向通道类型的底层类型可以被表示为chan T
    • 我们只能向一个只写的通道值发送数据,而不能从其中接收数据。 只写通道类型的底层类型可以被表示为chan<- T
    • 我们只能从一个只读的通道值接收数据,而不能向其发送数据。 只读通道类型的底层类型可以被表示为<-chan T

    通道一文详细解释了通道类型和通道值。

    事实:可比较类型和不可比较类型

    目前(Go 1.17),下面这些类型的值不支持(使用==和运算标识符)比较。这些类型称为不可比较类型。

    • 切片类型
    • 映射类型
    • 函数类型
    • 任何包含有不可比较类型的字段的结构体类型和任何元素类型为不可比较类型的数组类型。

    其它类型称为可比较类型。

    映射类型的键值类型必须为可比较类型。

    我们可以在类型转换、赋值和值比较规则大全一文中了解到更详细的比较规则。

    事实:Go对面向对象编程(object-oriented programming)的支持

    Go并不全面支持面向对象编程,但是Go确实支持一些面向对象编程的元素。请阅读以下几篇文章以获取详细信息:

    事实:Go对泛型(generics)的支持