调度器工作窃取与 NUMA 感知:优化多核 CPU 上的 goroutine 分布
探索 Go 调度器的 work-stealing 算法,以及如何通过 GOMAXPROCS 和亲和性设置适应非均匀内存访问架构。 · 难度:入门 · +10XP
调度器工作窃取与 NUMA 优化
Go 调度器使用工作窃取(work-stealing)算法在 P(处理器)之间平衡 goroutine。但在 NUMA 架构中,跨内存节点访问会带来延迟。本教程深入调度器源码,解释如何通过控制 GOMAXPROCS 和利用 runtime.LockOSThread 为关键 goroutine 绑定到特定 CPU。同时展示如何利用 runtime.GOMAXPROCS(0) 检测系统拓扑并调整并发度,提升计算密集型任务性能。
package main
import (
"fmt"
"runtime"
"sync"
)
func workStealingDemo() {
runtime.GOMAXPROCS(4) // 设置逻辑处理器数量
var wg sync.WaitGroup
for i := 0; i < 20; i++ {
wg.Add(1)
go func(id int) {
defer wg.Done()
// 模拟计算
sum := 0
for j := 0; j < 1000000; j++ {
sum += j
}
fmt.Printf("goroutine %d done
", id)
}(i)
}
wg.Wait()
}
func main() {
workStealingDemo()
}