加密賭場

如何根據概率確定停止時刻

為什麼需要「機會停止時刻」

停止是您停止遊戲/會話的預定事件，因為不利結果的概率超過了允許的閾值，或者相反，目標達到了。與情感「足夠」不同，概率停止依賴於以下內容：

1.結果障礙（利潤/縮水）；

2.機會估計（p，EV，方差）；

3.風險指標（Ruin的風險，錯誤推理的可能性，置信區間）；

4.停止測試（SPRT/貝葉斯規則）。

1）基本模型： 兩個吸收屏障（目標和停止）

讓我們想象一下通過步驟（利率/回合）變化的資本：以概率（p）向上，以概率（q=1-p）向下。我們引入了兩個障礙：頂部（+T）（利潤目標）和底部（-L）（停止麋鹿）。一旦資本到達其中之一-停止。

早於腳到達目標的概率（「玩家破產」類）

如果步驟的絕對大小和（p\ne q）相同，則開始時為0，目標為步驟（N=T/\Delta）向上和（M=L/\Delta）向下：

[
\mathsf {P} {\text{到}+T} =\frac {1-（q/p）^{M} {1-（q/p）^{M+n}}
]

При (p=q=0{.}5): (\mathsf{P}=\frac{M}{M+N}).

規則：選擇（T）和（L）使得（\mathsf {P}符合您的目標成功概率（例如≥ 60%）。這是在障礙上停下來：達到了一個水平-走出去。

實用結論：處於不利狀態（p\le 0.5）對稱目標和腳產生了≤50％的成功。只能通過障礙的不對稱性（較小的停止，較大的目標）或實際的（EV> 0）來補償。

2）在地平線盡頭停止破壞風險（RoR）

讓你擁有銀行（B），利率為（f），回合波動（\sigma），優勢（e）（每個回合的預期回報）。對於最終視野（N），您感興趣：「到最後跌破臨界水平（B_{\min}）的機會是什麼？」如果當前衰減（DD）下的條件性RoR已≥給定閾值（\beta）（例如5％），則停止。

工作啟發式方法：如果您從凱利（Kelly）玩股票，則在下降到允許的最大下垂時（例如，半凱利（Kelly）為20-30％）-停止恢復參數（重新計算（p，e ，\sigma），減少（f））。

3）在置信區間停止獲勝/概率

當真正的賠率（p）未知（插槽，輕量級市場）時，根據觀察值更新估計值。讓（n）嘗試的二元抽象為（w）「成功」。為（p）（例如Klopper-Pearson）構造雙向95％的DI。如果您實際電動汽車的DI上限降低≤ 0，則規則：

💡 停止，因為對於當前數據，即使是有利的估計也無法充分確定地確認積極的期望。

反向選項：如果（p）的DI下限高於使EV> 0的閾值,則可以繼續到最近的利潤/時間障礙。

4）貝葉斯停止： 「EV ≤ 0的概率」

將先驗設置為（p）（beta分布（\text {Beta} （\alpha_0,\beta_0）））。在（w）在（n）測試中「成功」之後（\text {Beta} （\alpha_0 +w,\beta_0 +n-w））。重新計算假設「（EV\le 0）」的周期後概率（考慮支付系數）。

如果規則（\mathsf {P} （EV\le0\mid\text {date}\ge\tau）（例如,80-90%）,則為停止。

優點：先驗信息的平穩學習，小樣本的可持續性。

5）串行Wald測試（SPRT）-「在線解決方案」

在每次結果之後，SPRT會即時檢查（H_0）與（H_1）。您給出了可接受的錯誤：（\alpha）（錯誤警報）和（\beta）（錯過了優勢），以及兩個關於（p）的假設：

(H_0:;p=p_0）（EV ≤ 0的邊界），（H_1:；p=p_1）（預期優勢）。

被認為是邏輯似然比（LLR）。

停止規則：

如果LLR ≥ （\ln\frac {1-\beta} {\alpha}）→接受（H_1）（確認優勢）或達到目標。
如果LLR ≤ （\ln\frac {\beta} {1-\alpha}）→接受（H_0）（沒有好處）並停止。
否則-繼續收集觀察結果。

在哪裏，有用：在評估「活著/死了」的情況下，在喜歡或新的促銷/合作條件下的策略。

6）三個實際的「停止規則」（可以一起應用）

1.結果障礙（T/L）：

預先確定利潤目標（+T）和止損目標（-L）與期望的成功概率（\mathsf {P}（第1條中的公式）相一致。達到了一個障礙-出路。

2.電動汽車的信心規則：

在（k）回合的每個塊之後，重新計算DI/貝葉斯概率。如果EV> 0中的信任不足（DI包括0或（\mathsf {P} （EV\le 0）\ge\tau））-停止。

3.破產風險規則：

如果條件的RoR一直到地平線末端（\beta）或達到允許的下降限制（例如，半凱利為20％），即使沒有達到目標，也可以停止。

7）迷你計算器（紙張）

A.選擇T/L作為成功的目標

輸入分數（p）（或範圍）。

選擇步驟（\Delta）和目標（M=L/\Delta）, （N=T/\Delta）。

從§1公式計算（\mathsf {P}）。選擇（M, N）（\mathsf {P}\ge P_{\text{target}}）（例如,60%）。

確定障礙，不要在旅途中改變（否則停止數學就會崩潰）。

B. EV信心檢驗（頻率方法）

每（k）回合建造95%的DI for （p）。

根據付款和費用重新計算電動汽車。

如果DI的上限（對於負假設）或下限（對於正）邊界在§3規則下與0相交-停止/繼續。

C.貝葉斯觸發器

Prior （\text {Beta} （1.1））（中性）或內容豐富。

在每個單元之後更新後期並計數（\mathsf {P} （EV\le 0））。

閾值（\tau）為0。8–0.9以保守的方式停止。

D.破產/倒塌風險

他從Kelly（f）（最好是⅓-Kelly ½）獲得股份。

設置最大有效的DD縮寫（_{\max}）（20-30%）。

如果當前的DD ≥ DD（_{\max}）或條件的RoR ≥ （\beta）（例如，5％）是停止。

8）示例腳本和現成的模板

腳本1。正電動汽車,高波動（插槽,frispins）

（f\approx）⅓ Kelly；障礙：（T=+3\s\sigma）會議到達（L=-2\s\sigma）。

每100-200個自旋是貝葉斯檢查（\mathsf {P}（EV\le 0））。

三個站點中的任何一個都觸發-輸出。

腳本2。帶系數優勢的投註

利潤/損失壁壘以利率單位為單位（例如（T=+10u），（L=-6u））。

SPRT с (\alpha=0.1,\ \beta=0.（2）在（p_0）（無優勢）和（p_1）（預期）之間。

銀行的20％下降是一個技術停頓。

腳本3。新策略測試

微觀利率，有限的測試庫。

每個（k）事件均為（p）計量；如果DI包含零EV →停止，則對假設進行修訂。

9）打破停止的錯誤

屏障運動（「讓我們繼續拉動」）-概率保證的含義丟失了。

忽略相關性（系列，市場依賴性）-重新評估獨立測試的數量。

在沒有重新計算規則的情況下改變投註大小-方差/EV發生變化，舊閾值無效。

僅固定利潤而沒有信心和RoR的指標是「達到」多余下降的高機會。

10）底線： 簡單的過程公式

1.在開始之前：設置（T）、（L）、變頻率（k）、閾值（\tau）（用於（\mathsf {P} （EV\le 0）））, （\alpha,\beta）（用於SPRT）、DD （{\max}、（\beta {text} RoR}}）。

2.在遊戲中：在每個步驟/單元之後,檢查觸發器（障礙、電動汽車信心、RoR/下降）。

3.觸發任何觸發器時：無異常停止。

4.會話後：log-重新計算（p, e,\sigma）,更新閾值。

如果你堅持這些規則，「可能性停止的時刻」將從直觀的停頓轉變為嚴格的管理決定：當你在統計上無法接受不利發展的機會時，你就會停止遊戲-並為下一個更高質量的機會保留資本和優勢。