关于回测性能和超大内存执行#

最近 Reddit 上两个相关帖子启发了本文：

声称 backtrader 无法处理 160 万根 K 线的帖子：reddit/r/algotrading - A performant backtesting system?
需要一个能回测 8000 支股票的工具：reddit/r/algotrading - Backtesting libs that supports 1000+ stocks?

其中一位作者问如何使用能回测”超大内存”的框架，”因为显然不能将所有数据加载到内存中。”

本文将通过 backtrader 来讨论这些概念。

2M K线#

为了验证，首先生成这么多 K 线。第一个帖子提到 77 支股票和 160 万根 K 线，每支约 20,779 根。因此我们简化如下：

为 100 支股票生成 K线数据
每支股票生成 20,000 根 K线
即：生成 100 个文件，总共 200 万根 K线。

生成数据的脚本如下：

import numpy as np
import pandas as pd

COLUMNS = ['open', 'high', 'low', 'close', 'volume', 'openinterest']
CANDLES = 20000
STOCKS = 100

dateindex = pd.date_range(start='2010-01-01', periods=CANDLES, freq='15min')

for i in range(STOCKS):
    data = np.random.randint(10, 20, size=(CANDLES, len(COLUMNS)))
    df = pd.DataFrame(data * 1.01, dateindex, columns=COLUMNS)
    df = df.rename_axis('datetime')
    df.to_csv('candles{:02d}.csv'.format(i))

脚本生成了 100 个文件（candles00.csv 到 candles99.csv）。数据值并不重要，关键是保持标准的日期时间格式和 OHLCV 数据（含未平仓合约）。

测试系统#

硬件/操作系统：使用的是一台 Windows 10 15.6 英寸的笔记本，配备 Intel i7 处理器和 32GB 内存。

Python 版本：CPython 3.6.1 和 pypy3 6.0.0。

其他：持续运行的应用程序占用约 20% 的 CPU，浏览器（Chrome 102 个进程）、Edge、Word、PowerPoint、Excel 及其他一些小程序正在运行。

backtrader 默认配置#

让我们回顾一下 backtrader 的默认运行时配置：

如果可能，预加载所有数据源
如果所有数据源都可以预加载，则以批处理模式运行（命名为 runonce）
先计算所有指标
按步骤执行策略逻辑和经纪人

默认批处理模式执行#

测试脚本（见完整源码）将打开 100 个文件并用 backtrader 默认配置处理。

$ ./two-million-candles.py
Cerebro Start Time:          2019-10-26 08:33:15.563088
Strat Init Time:             2019-10-26 08:34:31.845349
Time Loading Data Feeds:     76.28
Number of data feeds:        100
Strat Start Time:            2019-10-26 08:34:31.864349
Pre-Next Start Time:         2019-10-26 08:34:32.670352
Time Calculating Indicators: 0.81
Next Start Time:             2019-10-26 08:34:32.671351
Strat warm-up period Time:   0.00
Time to Strat Next Logic:    77.11
End Time:                    2019-10-26 08:35:31.493349
Time in Strategy Next Logic: 58.82
Total Time in Strategy:      58.82
Total Time:                  135.93
Length of data feeds:        20000
Memory Usage: A peak of 348 Mbytes was observed

大部分时间实际上是在预加载数据（98.63 秒），其余时间用于策略执行（包括在每次迭代中通过经纪人进行处理，耗时 73.63 秒）。总时间为 173.26 秒。

性能为：每秒 14,713 根 K线。

结论：上述第一个 Reddit 线程中声称 backtrader 无法处理 160 万根 K线的说法是错误的。

使用 pypy#

既然有帖子说用 pypy 没帮助，来看看实际表现。

$ ./two-million-candles.py
Cerebro Start Time:          2019-10-26 08:39:42.958689
Strat Init Time:             2019-10-26 08:40:31.260691
Time Loading Data Feeds:     48.30
Number of data feeds:        100
Strat Start Time:            2019-10-26 08:40:31.338692
Pre-Next Start Time:         2019-10-26 08:40:31.612688
Time Calculating Indicators: 0.27
Next Start Time:             2019-10-26 08:40:31.612688
Strat warm-up period Time:   0.00
Time to Strat Next Logic:    48.65
End Time:                    2019-10-26 08:40:40.150689
Time in Strategy Next Logic: 8.54
Total Time in Strategy:      8.54
Total Time:                  57.19
Length of data feeds:        20000

总时间已经从 135.93 秒降到了 57.19 秒，性能提升了超过一倍。

性能为：每秒 34,971 根 K线。

内存使用：最大内存峰值为 269 MB。

这也相较于标准 CPython 解释器，内存使用有所改善。

处理 200 万根 K 线时的超大内存#

可以通过 backtrader 的配置选项进一步优化，包括优化缓冲区、仅使用最小数据集（理想情况下缓冲区大小为 1）。

优化选项为 exactbars=True。文档描述如下：

True 或 1：所有”线”对象将内存使用减少到自动计算的最小周期。
如果简单移动平均线周期为 30，底层数据将始终保留 30 根 K 线的运行缓冲区以计算该均线。

此设置会禁用 preload 和 runonce。

由于绘图会被禁用，还可使用 stdstats=False 禁用标准观察器（现金、资产价值和交易）。

$ ./two-million-candles.py --cerebro exactbars=False,stdstats=False
Cerebro Start Time:          2019-10-26 08:37:08.014348
Strat Init Time:             2019-10-26 08:38:21.850392
Time Loading Data Feeds:     73.84
Number of data feeds:        100
Strat Start Time:            2019-10-26 08:38:21.851394
Pre-Next Start Time:         2019-10-26 08:38:21.857393
Time Calculating Indicators: 0.01
Next Start Time:             2019-10-26 08:38:21.857393
Strat warm-up period Time:   0.00
Time to Strat Next Logic:    73.84
End Time:                    2019-10-26 08:39:02.334936
Time in Strategy Next Logic: 40.48
Total Time in Strategy:      40.48
Total Time:                  114.32
Length of data feeds:        20000

性能为：每秒 17,494 根 K线。

内存使用：固定为 75 MB。

与之前未经优化的运行对比，预加载数据的时间已经不再是瓶颈，回测过程几乎可以立刻开始。

总时间为 114.32 秒，相较于 135.93 秒，改善了 15.90%。

内存使用改善了 68.5%。

再次使用 pypy#

现在我们已经知道如何优化，接下来再次用 pypy 来做测试。

$ ./two-million-candles.py --cerebro exactbars=True,stdstats=False
Cerebro Start Time:          2019-10-26 08:44:32.309689
Strat Init Time:             2019-10

-26 08:45:22.177687
Time Loading Data Feeds:     58.80
Number of data feeds:        100
Strat Start Time:            2019-10-26 08:45:22.178689
Pre-Next Start Time:         2019-10-26 08:45:22.181688
Time Calculating Indicators: 0.26
Next Start Time:             2019-10-26 08:45:22.181688
Strat warm-up period Time:   0.00
Time to Strat Next Logic:    58.79
End Time:                    2019-10-26 08:45:42.316689
Time in Strategy Next Logic: 20.14
Total Time in Strategy:      20.14
Total Time:                  78.90
Length of data feeds:        20000

性能：每秒 50,956 根 K线。