如何根據概率確定停止時刻
為什麼需要「機會停止時刻」
停止是您停止遊戲/會話的預定事件,因為不利結果的概率超過了允許的閾值,或者相反,目標達到了。與情感「足夠」不同,概率停止依賴於以下內容:1.結果障礙(利潤/縮水);
2.機會估計(p,EV,方差);
3.風險指標(Ruin的風險,錯誤推理的可能性,置信區間);
4.停止測試(SPRT/貝葉斯規則)。
1)基本模型: 兩個吸收屏障(目標和停止)
讓我們想象一下通過步驟(利率/回合)變化的資本:以概率(p)向上,以概率(q=1-p)向下。我們引入了兩個障礙:頂部(+T)(利潤目標)和底部(-L)(停止麋鹿)。一旦資本到達其中之一-停止。
早於腳到達目標的概率(「玩家破產」類)
如果步驟的絕對大小和(p\ne q)相同,則開始時為0,目標為步驟(N=T/\Delta)向上和(M=L/\Delta)向下:[
\mathsf {P} {\text{到}+T} =\frac {1-(q/p)^{M} {1-(q/p)^{M+n}}
]При (p=q=0{.}5): (\mathsf{P}=\frac{M}{M+N}).
規則:選擇(T)和(L)使得(\mathsf {P}符合您的目標成功概率(例如≥ 60%)。這是在障礙上停下來:達到了一個水平-走出去。
實用結論:處於不利狀態(p\le 0.5)對稱目標和腳產生了≤50%的成功。只能通過障礙的不對稱性(較小的停止,較大的目標)或實際的(EV> 0)來補償。
2)在地平線盡頭停止破壞風險(RoR)
讓你擁有銀行(B),利率為(f),回合波動(\sigma),優勢(e)(每個回合的預期回報)。對於最終視野(N),您感興趣:「到最後跌破臨界水平(B_{\min})的機會是什麼?」如果當前衰減(DD)下的條件性RoR已≥給定閾值(\beta)(例如5%),則停止。
工作啟發式方法:如果您從凱利(Kelly)玩股票,則在下降到允許的最大下垂時(例如,半凱利(Kelly)為20-30%)-停止恢復參數(重新計算(p,e ,\sigma),減少(f))。
3)在置信區間停止獲勝/概率
當真正的賠率(p)未知(插槽,輕量級市場)時,根據觀察值更新估計值。讓(n)嘗試的二元抽象為(w)「成功」。為(p)(例如Klopper-Pearson)構造雙向95%的DI。如果您實際電動汽車的DI上限降低≤ 0,則規則:反向選項:如果(p)的DI下限高於使EV> 0的閾值,則可以繼續到最近的利潤/時間障礙。
4)貝葉斯停止: 「EV ≤ 0的概率」
將先驗設置為(p) (beta分布(\text {Beta} (\alpha_0,\beta_0)))。在(w)在(n)測試中「成功」之後(\text {Beta} (\alpha_0 +w,\beta_0 +n-w))。重新計算假設「(EV\le 0)」的周期後概率(考慮支付系數)。
如果規則(\mathsf {P} (EV\le0\mid\text {date}\ge\tau)(例如,80-90%),則為停止。
優點:先驗信息的平穩學習,小樣本的可持續性。
5)串行Wald測試(SPRT)-「在線解決方案」
在每次結果之後,SPRT會即時檢查(H_0)與(H_1)。您給出了可接受的錯誤:(\alpha)(錯誤警報)和(\beta)(錯過了優勢),以及兩個關於(p)的假設:- (H_0:;p=p_0)(EV ≤ 0的邊界),(H_1:;p=p_1)(預期優勢)。
被認為是邏輯似然比(LLR)。
停止規則:- 如果LLR ≥ (\ln\frac {1-\beta} {\alpha})→接受(H_1)(確認優勢)或達到目標。
- 如果LLR ≤ (\ln\frac {\beta} {1-\alpha})→接受(H_0)(沒有好處)並停止。
- 否則-繼續收集觀察結果。
在哪裏,有用:在評估「活著/死了」的情況下,在喜歡或新的促銷/合作條件下的策略。
6)三個實際的「停止規則」(可以一起應用)
1.結果障礙(T/L):- 預先確定利潤目標(+T)和止損目標(-L)與期望的成功概率(\mathsf {P}(第1條中的公式)相一致。達到了一個障礙-出路。
- 在(k)回合的每個塊之後,重新計算DI/貝葉斯概率。如果EV> 0中的信任不足(DI包括0或(\mathsf {P} (EV\le 0)\ge\tau))-停止。
- 如果條件的RoR一直到地平線末端(\beta)或達到允許的下降限制(例如,半凱利為20%),即使沒有達到目標,也可以停止。
7)迷你計算器(紙張)
A.選擇T/L作為成功的目標
輸入分數(p)(或範圍)。
選擇步驟(\Delta)和目標(M=L/\Delta), (N=T/\Delta)。
從§1公式計算(\mathsf {P})。選擇(M, N) (\mathsf {P}\ge P_{\text{target}})(例如,60%)。
確定障礙,不要在旅途中改變(否則停止數學就會崩潰)。
B. EV信心檢驗(頻率方法)
每(k)回合建造95%的DI for (p)。
根據付款和費用重新計算電動汽車。
如果DI的上限(對於負假設)或下限(對於正)邊界在§3規則下與0相交-停止/繼續。
C.貝葉斯觸發器
Prior (\text {Beta} (1.1))(中性)或內容豐富。
在每個單元之後更新後期並計數(\mathsf {P} (EV\le 0))。
閾值(\tau)為0。8–0.9以保守的方式停止。
D.破產/倒塌風險
他從Kelly(f)(最好是⅓-Kelly ½)獲得股份。
設置最大有效的DD縮寫(_{\max}) (20-30%)。
如果當前的DD ≥ DD(_{\max})或條件的RoR ≥ (\beta)(例如,5%)是停止。
8)示例腳本和現成的模板
腳本1。正電動汽車,高波動(插槽,frispins)
(f\approx)⅓ Kelly;障礙:(T=+3\s\sigma)會議到達(L=-2\s\sigma)。
每100-200個自旋是貝葉斯檢查(\mathsf {P}(EV\le 0))。
三個站點中的任何一個都觸發-輸出。
腳本2。帶系數優勢的投註
利潤/損失壁壘以利率單位為單位(例如(T=+10u),(L=-6u))。
SPRT с (\alpha=0.1,\ \beta=0.(2)在(p_0)(無優勢)和(p_1)(預期)之間。
銀行的20%下降是一個技術停頓。
腳本3。新策略測試
微觀利率,有限的測試庫。
每個(k)事件均為(p)計量;如果DI包含零EV →停止,則對假設進行修訂。
9)打破停止的錯誤
屏障運動(「讓我們繼續拉動」)-概率保證的含義丟失了。
忽略相關性(系列,市場依賴性)-重新評估獨立測試的數量。
在沒有重新計算規則的情況下改變投註大小-方差/EV發生變化,舊閾值無效。
僅固定利潤而沒有信心和RoR的指標是「達到」多余下降的高機會。
10)底線: 簡單的過程公式
1.在開始之前:設置(T)、(L)、變頻率(k)、閾值(\tau)(用於(\mathsf {P} (EV\le 0))), (\alpha,\beta)(用於SPRT)、DD ({\max}、(\beta {text} RoR}})。
2.在遊戲中:在每個步驟/單元之後,檢查觸發器(障礙、電動汽車信心、RoR/下降)。
3.觸發任何觸發器時:無異常停止。
4.會話後:log-重新計算(p, e,\sigma),更新閾值。
如果你堅持這些規則,「可能性停止的時刻」將從直觀的停頓轉變為嚴格的管理決定:當你在統計上無法接受不利發展的機會時,你就會停止遊戲-並為下一個更高質量的機會保留資本和優勢。
