Go 常见错误及如何避免

代码及工程组织

意外的变量隐藏

避免变量隐藏（外部作用域变量被内部作用域同名变量隐藏），有助于避免变量引用错误，有助于他人阅读理解。

不必要的代码嵌套

避免不必要的、过多的嵌套层次，并且让正常代码路径尽量左对齐（而不是放在分支路径中），有助于构建可读性更好的代码。

误用 init 函数

初始化变量时，请记住 init 函数具有有限的错误处理能力，并且会使状态处理和测试变得更加复杂。在大多数情况下，初始化应该作为特定函数来处理。

滥用 getters/setters

在 Go 语言中，强制使用 getter 和 setter 方法并不符合 Go 惯例。在实践中，应该找到效率和盲目遵循某些惯用法之间的平衡点。

接口污染

抽象应该被发现，而不是被创造。为了避免不必要的复杂性，需要时才创建接口，而不是预见到需要它，或者至少可以证明这种抽象是有价值的。

将接口定义在实现方一侧

将接口保留在引用方一侧（而不是实现方一侧）可以避免不必要的抽象。

将接口作为返回值

为了避免在灵活性方面受到限制，大多数情况下函数不应该返回接口，而应该返回具体的实现。相反，函数应该尽可能地使用接口作为参数。

`any` 没传递任何信息

只有在需要接受或返回任意类型时，才使用 any，例如 json.Marshal。其他情况下，因为 any 不提供有意义的信息，可能会导致编译时问题，如允许调用者调用方法处理任意类型数据。

困惑何时该用范型

使用泛型，可以通过类型参数分离具体的数据类型和行为，避免写很多重复度很高的代码。然而，不要过早地使用泛型、类型参数，只有在你看到真正需要时才使用。否则，它们会引入不必要的抽象和复杂性。

未意识到类型嵌套的可能问题

使用类型嵌套也可以避免写一些重复代码，然而，在使用时需要确保不会导致不合理的可见性问题，比如有些字段应该对外隐藏不应该被暴露。

不使用 function option 模式

为了设计并提供更友好的 API（可选参数），为了更好地处理选项，应该使用 function option 模式。

工程组织不合理 (工程结构和包的组织)

遵循像 project-layout 的建议来组织 Go 工程是一个不错的方法，尤其是你正在寻找一些类似的经验、惯例来组织一个新的 Go 工程的时候。

创建工具包

命名是软件设计开发中非常重要的一个部分，创建一些名如 common、util、shared 之类的包名并不会给读者带来太大价值，应该将这些包名重构为更清晰、更具体的包名。

忽略了包名冲突

为了避免变量名和包名之间的冲突，导致混淆或甚至错误，应为每个变量和包使用唯一的名称。如果这不可行，可以考虑使用导入别名 import importAlias 'importPath' 以区分包名和变量名，或者考虑一个更好的变量名。

代码缺少文档

为了让使用方、维护人员能更清晰地了解你的代码的意图，导出的元素（函数、类型、字段）需要添加注释。

不使用 linters 检查

为了改善代码质量、整体代码的一致性，应该使用 linters 和 formatters。

数据类型

八进制字面量引发的困惑

在阅读现有代码时，请记住以 0 开头的整数字面量是八进制数。此外，为了提高可读性，可以通过在前面加上 0o 来显式地表示八进制整数。

未注意可能的整数溢出

在 Go 中整数上溢出和下溢是静默处理的，所以你可以实现自己的函数来捕获它们。

没有透彻理解浮点数

比较浮点数时，通过比较二者的 delta 值是否介于一定的范围内，能让你写出可移植性更好的代码。

在进行加法或减法时，将具有相似数量级的操作分成同一组以提高精度 (过早指数对齐丢失精度)。此外，在进行加法和减法之前，应先进行乘法和除法 (加减法误差会被乘除放大)。

不理解 slice 的长度和容量

理解 slice 的长度和容量的区别，是一个 Go 开发者的核心知识点之一。slice 的长度指的是 slice 已经存储的元素的数量，而容量指的是 slice 当前底层开辟的数组最多能容纳的元素的数量。

不高效的 slice 初始化

当创建一个 slice 时，如果其长度可以预先确定，那么可以在定义时指定它的长度和容量。这可以改善后期 append 时一次或者多次的内存分配操作，从而改善性能。对于 map 的初始化也是如此。

困惑于 nil 和空 slice

为了避免常见的对 nil 和 empty slice 处理行为的混淆，例如在使用 encoding/json 或 reflect 包时，你需要理解 nil 和 empty slice 的区别。两者都是长度为零、容量为零的切片，但是 nil 切片不需要分配内存。

没有适当检查 slice 是否为空

检查一个 slice 是否包含任何元素，可以检查其长度，不管 slice 是 nil 还是 empty，检查长度都是有效的。这个检查方法也适用于 map。

为了设计更明确的 API，API 不应区分 nil 和空切片。

没有正确拷贝 slice

使用 copy 拷贝一个 slice 元素到另一个 slice 时，需要记得，实际拷贝的元素数量是二者 slice 长度中的较小值。

slice append 带来的预期之外的副作用

如果两个不同的函数操作的 slice 复用了相同的底层数组，它们对 slice 执行 append 操作时可能会产生冲突。使用 copy 来完整复制一个 slice 或者使用完整的 slice 表达式 [low:high:max] 限制最大容量，有助于避免产生冲突。当想对一个大 slice 进行 shrink 操作时，两种方式中，只有 copy 才可以避免内存泄漏。

slice 和内存泄漏

对于 slice 元素为指针，或者 slice 元素为 struct 但是该 struct 含有指针字段，当通过 slice[low:high] 操作取 subslice 时，对于那些不可访问的元素可以显式设置为 nil 来避免内存泄露。

map 和内存泄漏

一个 map 的 buckets 占用的内存只会增长，不会缩减。因此，如果它导致了一些内存占用的问题，你需要尝试不同的方式来解决，比如重新创建一个 map 代替原来的（原来的 map 会被 GC 掉），或者 map[keyType]valueType 中的 valueType 使用指针代替长度固定的数组或者 sliceHeader 来缓解过多的内存占用。

不正确的值比较

Go 中比较两个类型值时，如果是可比较类型，那么可以使用 == 或者 != 运算符进行比较，比如：booleans、numerals、strings、pointers、channels，以及字段全部是可比较类型的 structs。其他情况下，你可以使用 reflect.DeepEqual 来比较，用反射的话会牺牲一点性能，也可以使用自定义的实现和其他库来完成。

控制结构

忽略了 `range` 循环变量是一个拷贝

range 循环中的循环变量是遍历容器中元素值的一个拷贝。因此，如果元素值是一个 struct 并且想在 range 中修改它，可以通过索引值来访问并修改它，或者使用经典的 for 循环+索引值的写法（除非遍历的元素是一个指针）。

忽略了 `range` 循环中迭代目标值的计算方式 (channels 和 arrays)

传递给 range 操作的迭代目标对应的表达式的值，只会在循环执行前被计算一次，理解这个有助于避免犯一些常见的错误，例如不高效的 channel 赋值操作和 slice 迭代操作。

忽略了 `range` 循环中指针元素的影响

这里其实强调的是 range 迭代过程中，迭代变量实际上是一个拷贝。假设给另外一个容器元素（指针类型）赋值，且需要对迭代变量取地址转换成指针再赋值的话，这里潜藏着一个错误，就是 for 循环迭代变量是 per-variable-per-loop 而不是 per-variable-per-iteration。如果是通过局部变量（用迭代变量来初始化）或者使用索引值来直接引用迭代的元素，将有助于避免拷贝指针(迭代变量的地址)之类的 bug。

map 迭代过程中的错误假设（遍历顺序和迭代过程中插入）

使用 map 时，为了能得到确定一致的结果，应该记住 Go 中的 map 数据结构： 不会按照 key 对 data 进行排序，遍历时 key 不是有序的； 遍历时的顺序，也不是按照插入时的顺序； 没有一个确定性的遍历顺序，每次遍历顺序是不同的； 不能保证迭代过程中新插入的元素，在当前迭代中能够被遍历到；

忽略了 `break` 语句是如何工作的

配合 label 使用 break 和 continue，能够跳过一个特定的语句，在某些循环中存在 switch 和 select 语句的场景中就比较有帮助。

在循环中使用 `defer`

在循环中使用 defer 不能在每轮迭代结束时执行 defer 语句，但是将循环逻辑提取到函数内部会在每次迭代结束时执行 defer 语句。

字符串

没有理解 rune

理解 rune 类型对应的是一个 unicode 码点，每一个 unicode 码点其实是一个多字节的序列，不是一个 byte。这应该是 Go 开发者的核心知识点之一，理解了这个有助于更准确地处理字符串。

不正确的字符串遍历

使用 range 操作符对一个 string 进行遍历实际上是对 string 对应的 []rune 进行遍历，迭代变量中的索引值，表示的当前 rune 对应的 []rune 在整个 []rune(string) 中的起始索引。如果要访问 string 中的某一个 rune（比如第三个），首先要将字符串转换为 []rune 然后再按索引值访问。

误用 trim 函数

strings.TrimRight/strings.TrimLeft 移除在字符串尾部或者开头出现的一些 runes，函数会指定一个 rune 集合，出现在集合中的 rune 将被从字符串移除。而 strings.TrimSuffix/strings.TrimPrefix 是移除字符串的一个后缀/前缀。

不经优化的字符串拼接操作

对一个字符串列表进行遍历拼接操作，应该通过 strings.Builder 来完成，以避免每次迭代拼接时都分配一个新的 string 对象出来。

无用的字符串转换

bytes 包提供了一些和 strings 包相似的操作，可以帮助避免 []byte/string 之间的转换。

子字符串和内存泄漏

使用一个子字符串的拷贝，有助于避免内存泄漏，因为对一个字符串的 s[low:high] 操作返回的子字符串，其使用了和原字符串 s 相同的底层数组。

函数和方法

不知道使用哪种接收器类型

对于接收器类型是采用 value 类型还是 pointer 类型，应该取决于下面这几种因素，比如：方法内是否会对它进行修改，它是否包含了一个不能被拷贝的字段，以及它表示的对象有多大。如果有疑问，接收器可以考虑使用 pointer 类型。

从不使用命名的返回值

使用命名的返回值，是一种有效改善函数、方法可读性的方法，特别是返回值列表中有多个类型相同的参数。另外，因为返回值列表中的参数是经过零值初始化过的，某些场景下也会简化函数、方法的实现。但是需要注意它的一些潜在副作用。

使用命名的返回值时预期外的副作用

使用命名的返回值，因为它已经被初始化了零值，需要注意在某些情况下异常返回时是否需要给它赋予一个不同的值，比如返回值列表定义了一个有名参数 err error，需要注意 return err 时是否正确地对 err 进行了赋值。

返回一个 nil 接收器

当返回一个 interface 参数时，需要小心，不要返回一个 nil 指针，而是应该显式返回一个 nil 值。否则，可能会发生一些预期外的问题，因为调用方会收到一个非 nil 的值。

使用文件名作为函数入参

设计函数时使用 io.Reader 类型作为入参，而不是文件名，将有助于改善函数的可复用性、易测试性。

忽略 `defer` 语句中参数、接收器值的计算方式 (参数值计算, 指针, 和 value 类型接收器)

为了避免 defer 语句执行时就立即对 defer 要执行的函数的参数进行计算，可以考虑将要执行的函数放到闭包里面，然后通过指针传递参数给闭包内函数（或者通过闭包捕获外部变量），来解决这个问题。

错误管理

Panicking

使用 panic 是 Go 中一种处理错误的方式，但是只能在遇到不可恢复的错误时使用，例如：通知开发人员一个强依赖的模块加载失败了。

未考虑何时才应该包装 error

Wrapping（包装）错误允许您标记错误、提供额外的上下文信息。然而，包装错误会创建潜在的耦合，因为它使得原来的错误对调用者可见。如果您想要防止这种情况，请不要使用包装错误的方式。

不正确的错误类型比较

如果你使用 Go 1.13 引入的特性 fmt.Errorf + %w 来包装一个错误，当进行错误比较时，如果想判断该包装后的错误是不是指定的错误类型，就需要使用 errors.As，如果想判断是不是指定的 error 对象就需要用 errors.Is。

不正确的错误对象值比较

为了表达一个预期内的错误，请使用错误值的方式，并通过 == 或者 errors.Is 来比较。而对于意外错误，则应使用特定的错误类型（可以通过 errors.As 来比较）。

两次处理同一个错误

大多数情况下，错误仅需要处理一次。打印错误日志也是一种错误处理。因此，当函数内发生错误时，应该在打印日志和返回错误中选择其中一种。包装错误也可以提供问题发生的额外上下文信息，也包括了原来的错误（可考虑交给调用方负责打日志）。

不处理错误

不管是在函数调用时，还是在一个 defer 函数执行时，如果想要忽略一个错误，应该显式地通过 _ 来忽略（可注明忽略的原因）。否则，将来的读者就会感觉到困惑，忽略这个错误是有意为之还是无意中漏掉了。

不处理 `defer` 中的错误

大多数情况下，你不应该忽略 defer 函数执行时返回的错误，或者显式处理它，或者将它传递给调用方处理，可以根据情景进行选择。如果你确定要忽略这个错误，请显式使用 _ 来忽略。

并发编程: 基础

混淆并发和并行

理解并发（concurrency）、并行（parallelism）之间的本质区别是 Go 开发人员必须要掌握的。并发是关于结构设计上的，并行是关于具体执行上的。

认为并发总是更快

要成为一名熟练的开发人员，您必须意识到并非所有场景下都是并发的方案更快。对于任务中的最小工作负载部分，对它们进行并行化处理并不一定就有明显收益或者比串行化方案更快。对串行化、并发方案进行 benchmark 测试，是验证假设的好办法。

不清楚何时使用 channels 或 mutexes

了解 goroutine 之间的交互也可以在选择使用 channels 或 mutexes 时有所帮助。一般来说，并行的 goroutine 需要同步，因此需要使用 mutexes。相反，并发的 goroutine 通常需要协调和编排，因此需要使用 channels。

不明白竞态问题 (数据竞态 vs. 竞态条件和 Go 内存模型)

掌握并发意味着要认识到数据竞争（data races）和竞态条件（race conditions）是两个不同的概念。数据竞争，指的是有多个 goroutines 同时访问相同内存区域时，缺乏必要的同步控制，且其中至少有一个 goroutine 执行的是写操作。同时要认识到，没有发生数据竞争不代表程序的执行是确定性的、没问题的。当在某个特定的操作顺序或者特定的事件发生顺序下，如果最终的行为是不可控的，这就是竞态条件。

ps：数据竞争是竞态条件的子集，竞态条件不仅局限于访存未同步，它可以发生在更高的层面。go test -race 检测的是数据竞争，需要同步来解决，而开发者还需要关注面更广的竞态条件，它需要对多个 goroutines 的执行进行编排。

理解 Go 的内存模型以及有关顺序和同步的底层保证是防止可能的数据竞争和竞态条件的关键。

不理解不同工作负载类型对并发的影响

当创建一定数量的 goroutines 时，需要考虑工作负载的类型。如果工作负载是 CPU 密集型的，那么 goroutines 数量应该接近于 GOMAXPROCS 的值（该值取决于主机处理器核心数）。如果工作负载是 IO 密集型的，goroutines 数量就需要考虑多种因素，比如外部系统（考虑请求、响应速率）。

误解了 Go contexts

Go 的上下文（context）也是 Go 并发编程的基石之一。上下文允许您携带截止时间、取消信号和键值列表。

并发编程: 实践

传递不合适的 context

当我们传递了一个 context，我们需要知道这个 context 什么时候可以被取消，这点很重要，例如：一个 HTTP 请求处理器在发送完响应后取消 context。

ps: 实际上 context 表达的是一个动作可以持续多久之后被停止。

启动了一个 goroutine 但是不知道它何时会停止

避免 goroutine 泄漏，要有这种意识，当创建并启动一个 goroutine 的时候，应该有对应的设计让它能正常退出。

不注意处理 goroutines 和循环中的迭代变量

为了避免 goroutines 和循环中的迭代变量问题，可以考虑创建局部变量并将迭代变量赋值给局部变量，或者 goroutines 调用带参数的函数，将迭代变量值作为参数值传入，来代替 goroutines 调用闭包。

使用 select + channels 时误以为分支选择顺序是确定的

要明白，select 多个 channels 时，如果多个 channels 上的操作都就绪，那么会随机选择一个 case 分支来执行，因此要避免有分支选择顺序是从上到下的这种错误预设，这可能会导致设计上的 bug。

不正确使用通知 channels

发送通知时使用 chan struct{} 类型。

ps: 先明白什么是通知 channels，一个通知 channels 指的是只是用来做通知，而其中传递的数据没有意义，或者理解成不传递数据的 channels，这种称为通知 channels。其中传递的数据的类型为 struct{} 更合适。

不使用 nil channels

使用 nil channels 应该是并发处理方式中的一部分，例如，它能够帮助禁用 select 语句中的特定的分支。

不清楚该如何确定 channel size

根据指定的场景仔细评估应该使用哪一种 channel 类型（带缓冲的，不带缓冲的）。只有不带缓冲的 channels 可以提供强同步保证。

使用带缓冲的 channels 时如果不确定 size 该如何设置，可以先设为 1，如果有合理的理由再去指定 channels size。

ps: 根据 disruptor 这个高性能内存消息队列的实践，在某种读写 pacing 下，队列要么满要么空，不大可能处于某种介于中间的稳态。

忘记了字符串格式化可能带来的副作用（例如 etcd 数据竞争和死锁）

意识到字符串格式化可能会导致调用现有函数，这意味着需要注意可能的死锁和其他数据竞争问题。

ps: 核心是要关注 fmt.Sprintf + %v 进行字符串格式化时 %v 具体到不同的类型值时，实际上执行的操作是什么。比如 %v 这个 placeholder 对应的值是一个 context.Context，那么会就遍历其通过 context.WithValue 附加在其中的 values，这个过程可能涉及到数据竞争问题。书中提及的另一个导致死锁的案例本质上也是一样的问题，只不过又额外牵扯到了 sync.RWMutex 不可重入的问题。

使用 append 不当导致数据竞争

调用 append 不总是没有数据竞争的，因此不要在一个共享的 slice 上并发地执行 append。

误用 mutexes 和 slices、maps

请记住 slices 和 maps 是引用类型，有助于避免常见的数据竞争问题。

ps: 这里实际是因为错误理解了 slices 和 maps，导致写出了错误地拷贝 slices 和 maps 的代码，进而导致锁保护无效、出现数据竞争问题。

误用 `sync.WaitGroup`

正确地使用 sync.WaitGroup 需要在启动 goroutines 之前先调用 Add 方法。

忘记使用 `sync.Cond`

你可以使用 sync.Cond 向多个 goroutines 发送重复的通知。

不使用 `errgroup`

你可以使用 errgroup 包来同步一组 goroutines 并处理错误和上下文。

拷贝一个 `sync` 下的类型

sync 包下的类型不应该被拷贝。

标准库

使用了错误的 time.Duration

注意有些函数接收一个 time.Duration 类型的参数时，尽管直接传递一个整数是可以的，但最好还是使用 time API 中的方法来传递 duration，以避免可能造成的困惑和 bug。

ps: 重点是注意 time.Duration 定义的是 nanoseconds 数。

`time.After` 和内存泄漏

避免在重复执行很多次的函数（如循环中或 HTTP 处理函数）中调用 time.After，这可以避免内存峰值消耗。由 time.After 创建的资源仅在计时器超时才会被释放。

JSON 处理中的常见错误

类型嵌套导致的预料外的行为

要当心在 Go 结构体中嵌入字段，这样做可能会导致诸如嵌入的 time.Time 字段实现 json.Marshaler 接口，从而覆盖默认的 JSON 序列。

JSON 和单调时钟

当对两个 time.Time 类型值进行比较时，需要记住 time.Time 包含了一个墙上时钟（wall clock）和一个单调时钟（monotonic clock），而使用 == 运算符进行比较时会同时比较这两个。

Map 键对应值为 any

当提供一个 map 用来 unmarshal JSON 数据时，为了避免不确定的 value 结构我们会使用 any 来作为 value 的类型而不是定义一个 struct，这种情况下需要记得数值默认会被转换为 float64。

常见的 SQL 错误

忘记了 sql.Open 并没有与 db 服务器建立实际连接

需要调用 Ping 或者 PingContext 方法来测试配置并确保数据库是可达的。

忘记了使用连接池

作为生产级别的应用，访问数据库时应该关注配置数据库连接池参数。

没有使用 prepared 语句

使用 SQL prepared 语句能够让查询更加高效和安全。

误处理 null 值

使用 sql.NullXXX 类型处理表中的可空列。

不处理行迭代时的错误

调用 sql.Rows 的 Err 方法来确保在准备下一个行时没有遗漏错误。

不关闭临时资源（HTTP 请求体、`sql.Rows` 和 `os.File`）

最终要注意关闭所有实现 io.Closer 接口的结构体，以避免可能的泄漏。

响应 HTTP 请求后没有返回语句

为了避免在 HTTP 处理函数中出现某些意外的问题，如果想在发生 http.Error 后让 HTTP 处理函数停止，那么就不要忘记使用 return 语句来阻止后续代码的执行。

直接使用默认的 HTTP client 和 server

对于生产级别的应用，不要使用默认的 HTTP client 和 server 实现。这些实现缺少超时和生产环境中应该强制使用的行为。

测试

不对测试进行分类（build tags, 环境变量，短模式）

对测试进行必要的分类，可以借助 build tags、环境变量以及短模式，来使得测试过程更加高效。你可以使用 build tags 或环境变量来创建测试类别（例如单元测试与集成测试），并区分短测试与长时间测试，来决定执行哪种类型的。

ps: 了解下 go build tags，以及 go test -short。

不打开 race 开关

打开 -race 开关在编写并发应用时非常重要。这能帮助你捕获可能的数据竞争，从而避免软件 bug。

不打开测试的执行模式开关 (parallel 和 shuffle)

打开开关 -parallel 有助于加速测试的执行，特别是测试中包含一些需要长期运行的用例的时候。

打开开关 -shuffle 能够打乱测试用例执行的顺序，避免一个测试依赖于某些不符合真实情况的预设，有助于及早暴露 bug。

不使用表驱动的测试

表驱动的测试是一种有效的方式，可以将一组相似的测试分组在一起，以避免代码重复和使未来的更新更容易处理。

在单元测试中执行 sleep 操作

使用同步的方式、避免 sleep，来尽量减少测试的不稳定性和提高鲁棒性。如果无法使用同步手段,可以考虑重试的方式。

没有高效地处理 time API

理解如何处理使用 time API 的函数，是使测试更加稳定的另一种方式。您可以使用标准技术，例如将时间作为隐藏依赖项的一部分来处理，或者要求客户端提供时间。

不使用测试相关的工具包 (`httptest` 和 `iotest`)

这个 httptest 包对处理 HTTP 应用程序很有帮助。它提供了一组实用程序来测试客户端和服务器。

这个 iotest 包有助于编写 io.Reader 并测试应用程序是否能够容忍错误。

不正确的基准测试

不要重置或者暂停 timer

使用 time 方法来保持基准测试的准确性。

做出错误的微基准测试假设

增加 benchtime 或者使用 benchstat 等工具可以有助于微基准测试。

小心微基准测试的结果，如果最终运行应用程序的系统与运行微基准测试的系统不同。

对编译期优化要足够小心

确保测试函数是否会产生一些副作用，防止编译器优化欺骗你得到的基准测试结果。

被观察者效应所欺骗

为了避免被观察者效应欺骗，强制重新创建CPU密集型函数使用的数据。

没有去探索 go test 所有的特性

代码覆盖率

使用 -coverprofile 参数可以快速查看代码的测试覆盖情况，方便快速查看哪个部分需要更多的关注。

在不同的包中执行测试

单元测试组织到一个独立的包中，对于对外层暴露的接口，需要写一些测试用例。测试应该关注公开的行为，而非内部实现细节。

Utility 函数

处理错误时，使用 *testing.T 变量而不是经典的 if err != nil 可以让代码更加简洁易读。

设置和销毁

你可以使用 setup 和 teardown 函数来配置一个复杂的环境，比如在集成测试的情况下。

优化技术

不理解 CPU cache

CPU 架构

理解 CPU 缓存的使用对于优化 CPU 密集型应用很重要，因为 L1 缓存比主存快 50 到 100 倍。

Cache line

意识到 cache line 概念对于理解如何在数据密集型应用中组织数据非常关键。CPU 并不是一个一个字来获取内存。相反，它通常复制一个 64 字节长度的 cache line。为了获得每个 cache line 的最大效用，需要实施空间局部性。

一系列 struct 元素构成的 slice vs. 多个 slice 字段构成的 struct
概率性的问题

提高 CPU 执行代码时的可预测性，也是优化某些函数的一个有效方法。比如，固定步长或连续访问对 CPU 来说是可预测的，但非连续访问（例如链表）就是不可预测的。

cache 放置策略

要注意现代缓存是分区的（set associative placement，组相连映射），要注意避免使用 critical stride，这种步长情况下只能利用 cache 的一小部分。

critical stride，这种类型的步长，指的是内存访问的步长刚好等于 cache 大小。这种情况下，只有少部分 cacheline 被利用。

了解 CPU 缓存的较低层的 L1、L2 cache 不会在所有核间共享，编写并发处理逻辑时能避免写出一些降低性能的问题，比如伪共享（false sharing）。内存共享只是一种假象。

没有考虑指令级的并行

使用指令级并行（ILP）优化代码的特定部分，以允许 CPU 尽可能执行更多可以并行执行的指令。识别指令的数据依赖问题（data hazards）是主要步骤之一。

不了解数据对齐

记住 Go 中基本类型与其自身大小对齐，例如，按大小降序重新组织结构体的字段可以形成更紧凑的结构体（减少内存分配，更好的空间局部性），这有助于避免一些常见的错误。

不了解 stack vs. heap

了解堆和栈之间的区别是开发人员的核心知识点，特别是要去优化一个 Go 程序时。栈分配的开销几乎为零，而堆分配则较慢，并且依赖 GC 来清理内存。

不知道如何减少内存分配次数（API 调整，编译器优化和 `sync.Pool`）

减少内存分配次数也是优化 Go 应用的一个重要方面。这可以通过不同的方式来实现，比如仔细设计 API 来避免不必要的拷贝，以及使用 sync.Pool 来对分配对象进行池化。

不注意使用内联

使用快速路径的内联技术来更加有效地减少调用函数的摊销时间。

不使用 Go 问题诊断工具

了解 Go profiling 工具、执行时 tracer 来辅助判断一个应用程序是否正常，以及列出需要优化的部分。

不理解 GC 是如何工作的

理解如何调优 GC 能够带来很多收益，例如有助于更高效地处理突增的负载。

不了解 Docker 或者 K8S 对运行的 Go 应用的性能影响

为了避免 CPU throttling（CPU 限频）问题，当我们在 Docker 和 Kubernetes 部署应用时，要知道 Go 语言对 CFS（完全公平调度器）无感知。