如何根据概率确定停止时刻
为什么需要"机会停止时刻"
停止是您停止游戏/会话的预定事件,因为不利结果的概率超过了允许的阈值,或者相反,目标达到了。与情感"足够"不同,概率停止依赖于以下内容:1.结果障碍(利润/缩水);
2.机会估计(p,EV,方差);
3.风险指标(Ruin的风险,错误推理的可能性,置信区间);
4.停止测试(SPRT/贝叶斯规则)。
1)基本模型: 两个吸收屏障(目标和停止)
让我们想象一下通过步骤(利率/回合)变化的资本:以概率(p)向上,以概率(q=1-p)向下。我们引入了两个障碍:顶部(+T)(利润目标)和底部(-L)(停止麋鹿)。一旦资本到达其中之一-停止。
早于脚到达目标的概率("玩家破产"类)
如果步骤的绝对大小和(p\ne q)相同,则开始时为0,目标为步骤(N=T/\Delta)向上和(M=L/\Delta)向下:[
\mathsf {P} {\text{到}+T} =\frac {1-(q/p)^{M} {1-(q/p)^{M+n}}
]При (p=q=0{.}5): (\mathsf{P}=\frac{M}{M+N}).
规则:选择(T)和(L)使得(\mathsf {P}符合您的目标成功概率(例如≥ 60%)。这是在障碍上停下来:达到了一个水平-走出去。
实用结论:处于不利状态(p\le 0.5)对称目标和脚产生了≤50%的成功。只能通过障碍的不对称性(较小的停止,较大的目标)或实际的(EV> 0)来补偿。
2)在地平线尽头停止破坏风险(RoR)
让你拥有银行(B),利率为(f),回合波动(\sigma),优势(e)(每个回合的预期回报)。对于最终视野(N),您感兴趣:"到最后跌破临界水平(B_{\min})的机会是什么?"如果当前衰减(DD)下的条件性RoR已≥给定阈值(\beta)(例如5%),则停止。
工作启发式方法:如果您从凯利(Kelly)玩股票,则在下降到允许的最大下垂时(例如,半凯利(Kelly)为20-30%)-停止恢复参数(重新计算(p,e ,\sigma),减少(f))。
3)在置信区间停止获胜/概率
当真正的赔率(p)未知(插槽,轻量级市场)时,根据观察值更新估计值。让(n)尝试的二元抽象为(w)"成功"。为(p)(例如Klopper-Pearson)构造双向95%的DI。如果您实际电动汽车的DI上限降低≤ 0,则规则:反向选项:如果(p)的DI下限高于使EV> 0的阈值,则可以继续到最近的利润/时间障碍。
4)贝叶斯停止: "EV ≤ 0的概率"
将先验设置为(p) (beta分布(\text {Beta} (\alpha_0,\beta_0)))。在(w)在(n)测试中"成功"之后(\text {Beta} (\alpha_0 +w,\beta_0 +n-w))。重新计算假设"(EV\le 0)"的周期后概率(考虑支付系数)。
如果规则(\mathsf {P} (EV\le0\mid\text {date}\ge\tau)(例如,80-90%),则为停止。
优点:先验信息的平稳学习,小样本的可持续性。
5)串行Wald测试(SPRT)-"在线解决方案"
在每次结果之后,SPRT会即时检查(H_0)与(H_1)。您给出了可接受的错误:(\alpha)(错误警报)和(\beta)(错过了优势),以及两个关于(p)的假设:- (H_0:;p=p_0)(EV ≤ 0的边界),(H_1:;p=p_1)(预期优势)。
被认为是逻辑似然比(LLR)。
停止规则:- 如果LLR ≥ (\ln\frac {1-\beta} {\alpha})→接受(H_1)(确认优势)或达到目标。
- 如果LLR ≤ (\ln\frac {\beta} {1-\alpha})→接受(H_0)(没有好处)并停止。
- 否则-继续收集观察结果。
在哪里,有用:在评估"活着/死了"的情况下,在喜欢或新的促销/合作条件下的策略。
6)三个实际的"停止规则"(可以一起应用)
1.结果障碍(T/L):- 预先确定利润目标(+T)和止损目标(-L)与期望的成功概率(\mathsf {P}(第1条中的公式)相一致。达到了一个障碍-出路。
- 在(k)回合的每个块之后,重新计算DI/贝叶斯概率。如果EV> 0中的信任不足(DI包括0或(\mathsf {P} (EV\le 0)\ge\tau))-停止。
- 如果条件的RoR一直到地平线末端(\beta)或达到允许的下降限制(例如,半凯利为20%),即使没有达到目标,也可以停止。
7)迷你计算器(纸张)
A.选择T/L作为成功的目标
输入分数(p)(或范围)。
选择步骤(\Delta)和目标(M=L/\Delta), (N=T/\Delta)。
从§1公式计算(\mathsf {P})。选择(M, N) (\mathsf {P}\ge P_{\text{target}})(例如,60%)。
确定障碍,不要在旅途中改变(否则停止数学就会崩溃)。
B. EV信心检验(频率方法)
每(k)回合建造95%的DI for (p)。
根据付款和费用重新计算电动汽车。
如果DI的上限(对于负假设)或下限(对于正)边界在§3规则下与0相交-停止/继续。
C.贝叶斯触发器
Prior (\text {Beta} (1.1))(中性)或内容丰富。
在每个单元之后更新后期并计数(\mathsf {P} (EV\le 0))。
阈值(\tau)为0。8–0.9以保守的方式停止。
D.破产/倒塌风险
他从Kelly(f)(最好是⅓-Kelly ½)获得股份。
设置最大有效的DD缩写(_{\max}) (20-30%)。
如果当前的DD ≥ DD(_{\max})或条件的RoR ≥ (\beta)(例如,5%)是停止。
8)示例脚本和现成的模板
脚本1。正电动汽车,高波动(插槽,frispins)
(f\approx)⅓ Kelly;障碍:(T=+3\s\sigma)会议到达(L=-2\s\sigma)。
每100-200个自旋是贝叶斯检查(\mathsf {P}(EV\le 0))。
三个站点中的任何一个都触发-输出。
脚本2。带系数优势的投注
利润/损失壁垒以利率单位为单位(例如(T=+10u),(L=-6u))。
SPRT с (\alpha=0.1,\ \beta=0.(2)在(p_0)(无优势)和(p_1)(预期)之间。
银行的20%下降是一个技术停顿。
脚本3。新策略测试
微观利率,有限的测试库。
每个(k)事件均为(p)计量;如果DI包含零EV →停止,则对假设进行修订。
9)打破停止的错误
屏障运动("让我们继续拉动")-概率保证的含义丢失了。
忽略相关性(系列,市场依赖性)-重新评估独立测试的数量。
在没有重新计算规则的情况下改变投注大小-方差/EV发生变化,旧阈值无效。
仅固定利润而没有信心和RoR的指标是"达到"多余下降的高机会。
10)底线: 简单的过程公式
1.在开始之前:设置(T)、(L)、变频率(k)、阈值(\tau)(用于(\mathsf {P} (EV\le 0))), (\alpha,\beta)(用于SPRT)、DD ({\max}、(\beta {text} RoR}})。
2.在游戏中:在每个步骤/单元之后,检查触发器(障碍、电动汽车信心、RoR/下降)。
3.触发任何触发器时:无异常停止。
4.会话后:log-重新计算(p, e,\sigma),更新阈值。
如果你坚持这些规则,"可能性停止的时刻"将从直观的停顿转变为严格的管理决定:当你在统计上无法接受不利发展的机会时,你就会停止游戏-并为下一个更高质量的机会保留资本和优势。
