问题的起点非常明确:一个外部系统以极高频率向我们推送小型计算任务,峰值可达每秒数万次。每个任务本身处理起来并不复杂,但其背后依赖一个CPU密集型的模拟模型。直接处理这些原子化请求会立刻摧毁后端系统,因为模型的初始化和单次运行的固定开销远大于
2023-10-27