如何理解你的策略已经停止运作
有时策略会"坚持"数月,然后突然产生一系列糟糕的战斗。这可能是一个分散噪声-并且可能是真正的降解:RTP版本的变化,股票条件的变化,限制校准错误。下面是一个清晰的系统,如何区分噪声和剪切以及该怎么做。
1)什么意思"停止工作"
如果战略的关键指标持续超越先前观察到的走廊,或者与基地相比失去统计意义,战略就停止了运作。
基本监控套件(例如,在蹦床上,每1,000个旋转):- EV batcha(平均总数,银行百分比)。
- 中位数(Q 50)和分数Q75/Q90是玩家"生活在"中位数和尾巴中。
- Max Drawdown(深度和持续时间)。
- 目标机会(完成战斗≥0%,≥+20%)。
- HF和最长间隔为≥×10/bonusa(中位数,第75 percentil)。
- 在战斗中破产的风险。
规范走廊固定在"健康"时期(基线),并用作基准。
2)降解信号: 快速识别规则
信号不是一个糟糕的战斗,而是模式:1.幅度+稳定性。
EV低于基本X点。连续3个以上的战斗中;
Q90下降超过基线走廊2个连续的窗口;
≥0%的机会在最后四个窗口的3个窗口中下降了≥ Y。
2.同时性。几个指标一起"变红":EV↓,Q50↓,prosadka↑,机会tseley↓。
3.分布形式的变化。
HF几乎没有变化,但是间隔≥×10加长→"动作"变得越来越少。
尾巴变得更重(在以前的电动汽车下更常见的是深沉入)→风险状况较差。
4.按投资组合的系统性。信号出现在多个插槽/脚本中(不是局部随机性)。
3)早期检测工具(没有复杂的数学)
A)滑动窗口
支持两个窗口:"短"(最后10-20个战斗)和"长"(基地)。如果EV/中位数的差异超出基地的信任带-信号候选。
B)舒哈特控制卡
对于每个指标,请保持:基本周期的平均值± k· σ。
超出3 σ是强烈的焦虑。
连续三分之二,单程两σ-平均焦虑。
从平均水平开始,连续7个点是一个趋势。
C)CUSUM
度量偏离其基本平均值的累积和。在CUSUM中,逐渐的"下滑"通常比点发射更早。
G)更改点测试(实用)
在蹦床上比较"更早"vs "now":butstrap差距间隔和重新排列的p测试。如果0超出95% DI和p <0。05-你有一个正式的转变。
4)虚假警报: 如何不使色散与故障混淆
最小体积。不要在波动的插槽窗口中得出关于<20 batch的结论。
模拟统一噪声(CRN)。如果您检查模型中的策略-在相同的"噪音"上进行比较。
多次检查。如果度量很多,则使用"双重确认"规则:如果两个独立度量或一个+CUSUM度量有效,则将计算信号。
日历因素。股票/腰果的结束,限额的变化,提供商的新版本-记录在日志中,以免解释的变化伪装成"策略故障"。
5)原因诊断(支票单)
1.RTP池/游戏版本是否发生了变化?
2.外部付款改变了吗?(腰包,锦标赛积分,任务)
3.纪律改变了吗?(违反限制,利率成为银行的股份而不是平局,其他长度)
4.投资组合波动是否发生了变化?(更多高运动游戏)
5.技术因素。(自动旋转速度、延迟、拼写失败)
6.策略是为过去而定的?(症状-退出优化期后立即退化)
6)边界条件(guardrails)-何时敲钟
提前设置暂停策略的停止触发器:- EV (20 batches滑动窗口)<基数5 pp和 pp>基数 20%-暂停。
- 破损风险>目标(例如,每个战斗时间10%)连续两个窗口-暂停。
- 完成机会为≥0%<基本减去10个百分点4个窗口中的3个是暂停。
7)如果信号被确认,该怎么办
步骤1。暂停策略。减少曝光:降低银行利率/份额或暂时停止。
步骤2。在演示中转发。在演示/模拟中重新检查同一插槽/规则集上的度量标准。
步骤3。隔离因素。返回一个以前的条件(RTP池、出价、蹦床长度、公文包)。
步骤4。重新校准限制。也许这个想法本身是活的,但需要不同的停止驼鹿/铲球和会话长度。
步骤5。解决方案。
在v2中(如果度量在静止和低曝光时恢复)。
存档(如果已确认退化并且没有可解释的措施)。
8)小型监控程序(可插入法规)
1.Butch:1,000个旋转;报告-每10个战斗(滑动窗口)一次。
2.度量标准:EV,Q50/Q90总数,Q90缩小(深度/持续时间),机会为≥0%/≥+20%,HF,间隔中位数≥×10。
3.基地:"健康时期"的前60个战斗。我们保留平均,σ和信任条。
4.控制:Shuhart(3 σ/2 σ),CUSUM,butstrap比较"提前/现在"。
5.更改日志:RTP版本、促销、策略编辑。
6.Gardrails:暂停触发器(来自第6节)。
7.行动:暂停→演示→事后返回→决定。
9)"策略健康护照"模板"
时期: 基地(Batches):当前战斗:- EV(基数/现在):……%/……%[Δ……p.p.]
- Q50/Q90结果:……%/……%→……%/……%
- Q90 DD(深度/持续时间):……/……→费率……/……
- 机会≥0%/≥+20%:……/……→……/……
- HF/间隔中位数 ≥×10:……/……旋转→……/……
- 信号:Shuhart(……);CUSUM (…);p测试(p=.);状态:OK/注意/暂停
- 解决方案:继续/降低费率/暂停和退房/存档。
10)"诊断"中的频繁错误"
一个数字的恋物癖。在不考虑分位数和衰减的情况下得出电动汽车的结论。
短窗户。在高连通性插槽上处理5-10个蹦床的解决方案是噪音。
缺乏基地。没有基准可以衡量这一转变。
即时改变规则。在糟糕的战斗之后,"操纵"了极限-破坏了可比性。
忽略上下文。RTP日志中未包含的股票/更改使图片混淆。
结果:该策略"停止工作"不是在一次失败的战斗中,而是在几个独立的指标和基准测试表明基线走廊之外有稳定的转变时。保持底座,滑动窗口,控制卡和清晰的gardrails-并及时区分分散噪声与实际降解,降低风险并采取有意义的行动:暂停,撤销,重新校准或存档。
