Як визначити момент зупинки ймовірно

Навіщо потрібен «момент зупинки за ймовірністю»

Зупинка - це заздалегідь визначена подія, при якій ви припиняєте гру/сесію, тому що ймовірність несприятливого результату перевищила допустимий поріг, або, навпаки, мета досягнута. На відміну від емоційного «вистачить», ймовірнісна зупинка спирається на:

1. Бар'єри результату (прибуток/осідання);

2. Оцінку шансів (p, EV, дисперсія);

3. Ризик-метрики (Risk of Ruin, ймовірність помилкового висновку, довірчі інтервали);

4. Тести зупинки (SPRT/байєсівські правила).

1) Базова модель: два поглинаючі бар'єри (мета і стоп)

Представимо капітал, що змінюється ступенями (ставка/раунд): вгору з імовірністю (p), вниз з імовірністю (q = 1-p). Вводимо два бар'єри: верхній (+ T) (мета прибутку) і нижній (-L) (стоп-лосс). Як тільки капітал досягає одного з них - зупинка.

Ймовірність дійти до мети раніше стопа (клас «розорення гравця»)

Якщо кроки однакові за абсолютною величиною і (p\ne q), то при старті на 0, з цілями в кроках (N = T/\Delta) вгору і (M = L/\Delta) вниз:

[
\ mathsf {P} {\text {дійти до} + T}; = ;\frac {1- (q/p) ^ {M}} {1- (q/p) ^ {M + N}}
]

При (p = q = 0 {.} 5): (\mathsf{P}=\frac{M}{M+N}).

Правило: вибирайте (T) і (L) так, щоб (\mathsf {P}) відповідала вашій цільовій ймовірності успіху (наприклад, ≥ 60%). Це - зупинка по бар'єру: досягли одного з рівнів - вийти.

Практичний висновок: при несприятливому (p\le 0. 5) симетричні цілі і стопи дають ≤50% успіху. Компенсувати можна тільки асиметрією бар'єрів (менший стоп, велика мета) або фактичним (EV> 0).

2) Зупинка по ризику розорення (RoR) до кінця горизонту

Нехай у вас банк (B), ставка як частка (f), волатильність раунду (\sigma), перевага (e) (очікувана прибутковість на раунд). Для кінцевого горизонту (N) вас цікавить: «Який шанс впасти нижче критичного рівня (B_{\min}) до кінця?» Якщо умовний RoR при поточному осіданні (DD) став ≥ заданого порогу (\beta) (наприклад, 5%), зупиняємося.

Робоча евристика: якщо ви граєте часткою від Келлі, то при падінні в максимально допустиму осідання (наприклад, 20-30% при напів-Келлі) - зупинка до відновлення параметрів (перерахунок (p, e ,\sigma), зниження (f)).

3) Зупинка по довірчому інтервалу для виграшу/ймовірності

Коли справжні шанси (p) невідомі (слоти, лайв-ринки), ви оновлюєте оцінку за спостереженнями. Нехай у бінарній абстракції за (n) спроб було (w) «успіхів». Побудуйте двосторонній 95% ДІ для (p) (наприклад, Клоппера-Пірсона). Якщо верхня межа ДІ для вашого реального EV опускається ≤ 0, правило:

💡 Стоп, тому що при поточних даних навіть сприятлива оцінка не підтверджує позитивне очікування з достатньою впевненістю.

Зворотній варіант: якщо нижня межа ДІ для (p) вище порога, який робить ваш EV> 0 - можна продовжувати до найближчого бар'єру прибутку/часу.

4) Байєсівська зупинка: «ймовірність, що EV ≤ 0»

Задайте пріор на (p) (бета-розподіл (\text {Beta} (\alpha _ 0 ,\beta _ 0))). Після (w) «успіхів» в (n) випробуваннях постеріор (\text {Beta} (\alpha _ 0 + w ,\beta _ 0 + n-w)). Перерахуйте постеріорну ймовірність гіпотези «(EV\le 0)» (з урахуванням коефіцієнтів виплат).

Правило: якщо (\mathsf {P} (EV\le 0\mid\text {дані} )\ge\tau) (наприклад, 80-90%), - зупинка.

Плюси: плавне облікування апріорної інформації, стійкість на малих вибірках.

5) Послідовний тест Вальда (SPRT) - «онлайн-рішення»

SPRT перевіряє (H_0) проти (H_1) на льоту, після кожного результату. Ви задаєте прийнятні помилки: (\alpha) (помилкова тривога) і (\beta) (пропуск переваги), і дві гіпотези по (p):

(H_0:; p = p _ 0) (межа, де EV ≤ 0), (H_1:; p = p _ 1) (очікувана перевага).

Вважається лог-відношення правдоподібності (LLR).

Правила зупинки:

Якщо LLR ≥ (\ln\frac {1-\beta} {\alpha}) → прийняти (H_1) (перевага підтверджена) або вийти за метою.
Якщо LLR ≤ (\ln\frac {\beta} {1-\alpha}) → прийняти (H_0) (переваги немає) і зупинитися.
Інакше - продовжувати збирати спостереження.

Де корисно: при оцінці «жива/мертва» стратегія в лайві або за нових умов промо/коефів.

6) Три практичних «правила зупинки» (можна застосовувати разом)

1. Бар'єри результату (T/L):

Заздалегідь зафіксуйте ціль прибутку (+ T) і стоп-лосс (-L), узгоджені з бажаною ймовірністю успіху (\mathsf {P}) (формула в § 1). Досягли одного з бар'єрів - вихід.

2. Правило впевненості в EV:

Після кожного блоку з (k) раундів перераховуйте ДІ/байєсівську ймовірність. Якщо довіри в EV> 0 недостатньо (ДІ включає 0 або (\mathsf {P} (EV\le 0 )\ge\tau)) - стоп.

3. Правило ризику розорення:

Якщо умовний RoR до кінця горизонту ≥ (\beta) або досягнутий ліміт допустимого осідання (наприклад, 20% для напів-Келлі) - стоп, навіть якщо мета не досягнута.

7) Міні-калькулятори (паперові)

A. підбір T/L під цільову ймовірність успіху

Введіть оцінку (p) (або діапазон).

Виберіть крок (\Delta) і цільові (M = L/\Delta), (N = T/\Delta).

Розрахуйте (\mathsf {P}) з формули § 1. Підберіть (M, N), щоб (\mathsf {P }\ge P_{\text{target}}) (наприклад, 60%).

Зафіксуйте бар'єри і не міняйте по ходу (інакше ламається математика зупинки).

B. перевірка впевненості в EV (частотний підхід)

Кожні (k) раундів будуйте 95% ДІ для (p).

Перерахуйте EV з урахуванням виплат і комісій.

Якщо верхня (для негативної гіпотези) або нижня (для позитивної) межа ДІ перетинає 0 - стоп/продовжити за правилом § 3.

С. Байєсовський тригер

Пріор (\text {Beta} (1,1)) (нейтральний) або інформативний.

Після кожного блоку оновлюйте постеріор і рахуйте (\mathsf {P} (EV\le 0)).

Поріг (\tau) беріть 0. 8–0. 9 для консервативної зупинки.

D. ризик розорення/осідання

Працюєте часткою від Келлі (f) (краще ⅓ - ½ Келлі).

Задайте максимальну допустиму просадку DD (_{\max}) (20-30%).

Якщо поточна DD ≥ DD (_{\max}) або умовний RoR ≥ (\beta) (наприклад, 5%) - стоп.

8) Типові сценарії та готові шаблони

Сценарій 1. Позитивний EV, висока волатильність (слоти, фриспіни)

(f\approx) ⅓ Келлі; бар'єри: (T = + 3\s\sigma) прибутку сесії, (L = -2\s\sigma).

Кожні 100-200 спінів - байєсівська перевірка (\mathsf {P} (EV\le 0)).

Будь-яка з трьох зупинок спрацьовує - вихід.

Сценарій 2. Ставки з перевагою за коефіцієнтами

Бар'єри по прибутку/збитку в одиницях ставки (наприклад, (T = + 10u), (L = -6u)).

SPRT с (\alpha=0. 1,\ \beta=0. 2) між (p_0) (без переваги) і (p_1) (очікуване).

Просадка 20% банку - технічна зупинка.

Сценарій 3. Тест нової стратегії

Мікро-ставки, обмежений банк тесту.

Кожні (k) подій - ДІ по (p); якщо ДІ включає нульовий EV → стоп, перегляд гіпотез.

9) Помилки, які ламають зупинку

Рух бар'єрів («посунемо стоп ще раз») - втрачається сенс імовірнісних гарантій.

Ігнор кореляцій (серії, залежність ринків) - переоцінка числа незалежних випробувань.

Зміна розміру ставки без перерахунку правил - змінюється дисперсія/EV, старі пороги невалідні.

Фіксація тільки на прибутку без метрик впевненості і RoR - високий шанс «догратися» до зайвого осідання.

10) Підсумок: проста формула процесу

1. До старту: задайте (T), (L), частоту перетестів (k), пороги (\tau) (для (\mathsf {P} (EV\le 0))), (\alpha ,\beta) (для SPRT), DD ({\max}), (\beta {\text {RoR}}).

2. У грі: після кожного кроку/блоку перевіряйте тригери (бар'єри, впевненість в EV, RoR/осідання).

3. При спрацьовуванні будь-якого тригера: зупинка без винятків.

4. Після сесії: лог - перерахунок (p, e ,\sigma), оновлення порогів.

Якщо дотримуватися цих правил, «момент зупинки за ймовірністю» перетворюється з інтуїтивної паузи в суворе управлінське рішення: ви припиняєте гру саме тоді, коли шанс несприятливого розвитку став статистично неприйнятним - і зберігаєте капітал і перевагу для наступних, більш якісних можливостей.