Як визначити момент зупинки ймовірно
Навіщо потрібен «момент зупинки за ймовірністю»
Зупинка - це заздалегідь визначена подія, при якій ви припиняєте гру/сесію, тому що ймовірність несприятливого результату перевищила допустимий поріг, або, навпаки, мета досягнута. На відміну від емоційного «вистачить», ймовірнісна зупинка спирається на:1. Бар'єри результату (прибуток/осідання);
2. Оцінку шансів (p, EV, дисперсія);
3. Ризик-метрики (Risk of Ruin, ймовірність помилкового висновку, довірчі інтервали);
4. Тести зупинки (SPRT/байєсівські правила).
1) Базова модель: два поглинаючі бар'єри (мета і стоп)
Представимо капітал, що змінюється ступенями (ставка/раунд): вгору з імовірністю (p), вниз з імовірністю (q = 1-p). Вводимо два бар'єри: верхній (+ T) (мета прибутку) і нижній (-L) (стоп-лосс). Як тільки капітал досягає одного з них - зупинка.
Ймовірність дійти до мети раніше стопа (клас «розорення гравця»)
Якщо кроки однакові за абсолютною величиною і (p\ne q), то при старті на 0, з цілями в кроках (N = T/\Delta) вгору і (M = L/\Delta) вниз:[
\ mathsf {P} {\text {дійти до} + T}; = ;\frac {1- (q/p) ^ {M}} {1- (q/p) ^ {M + N}}
]При (p = q = 0 {.} 5): (\mathsf{P}=\frac{M}{M+N}).
Правило: вибирайте (T) і (L) так, щоб (\mathsf {P}) відповідала вашій цільовій ймовірності успіху (наприклад, ≥ 60%). Це - зупинка по бар'єру: досягли одного з рівнів - вийти.
Практичний висновок: при несприятливому (p\le 0. 5) симетричні цілі і стопи дають ≤50% успіху. Компенсувати можна тільки асиметрією бар'єрів (менший стоп, велика мета) або фактичним (EV> 0).
2) Зупинка по ризику розорення (RoR) до кінця горизонту
Нехай у вас банк (B), ставка як частка (f), волатильність раунду (\sigma), перевага (e) (очікувана прибутковість на раунд). Для кінцевого горизонту (N) вас цікавить: «Який шанс впасти нижче критичного рівня (B_{\min}) до кінця?» Якщо умовний RoR при поточному осіданні (DD) став ≥ заданого порогу (\beta) (наприклад, 5%), зупиняємося.
Робоча евристика: якщо ви граєте часткою від Келлі, то при падінні в максимально допустиму осідання (наприклад, 20-30% при напів-Келлі) - зупинка до відновлення параметрів (перерахунок (p, e ,\sigma), зниження (f)).
3) Зупинка по довірчому інтервалу для виграшу/ймовірності
Коли справжні шанси (p) невідомі (слоти, лайв-ринки), ви оновлюєте оцінку за спостереженнями. Нехай у бінарній абстракції за (n) спроб було (w) «успіхів». Побудуйте двосторонній 95% ДІ для (p) (наприклад, Клоппера-Пірсона). Якщо верхня межа ДІ для вашого реального EV опускається ≤ 0, правило:Зворотній варіант: якщо нижня межа ДІ для (p) вище порога, який робить ваш EV> 0 - можна продовжувати до найближчого бар'єру прибутку/часу.
4) Байєсівська зупинка: «ймовірність, що EV ≤ 0»
Задайте пріор на (p) (бета-розподіл (\text {Beta} (\alpha _ 0 ,\beta _ 0))). Після (w) «успіхів» в (n) випробуваннях постеріор (\text {Beta} (\alpha _ 0 + w ,\beta _ 0 + n-w)). Перерахуйте постеріорну ймовірність гіпотези «(EV\le 0)» (з урахуванням коефіцієнтів виплат).
Правило: якщо (\mathsf {P} (EV\le 0\mid\text {дані} )\ge\tau) (наприклад, 80-90%), - зупинка.
Плюси: плавне облікування апріорної інформації, стійкість на малих вибірках.
5) Послідовний тест Вальда (SPRT) - «онлайн-рішення»
SPRT перевіряє (H_0) проти (H_1) на льоту, після кожного результату. Ви задаєте прийнятні помилки: (\alpha) (помилкова тривога) і (\beta) (пропуск переваги), і дві гіпотези по (p):- (H_0:; p = p _ 0) (межа, де EV ≤ 0), (H_1:; p = p _ 1) (очікувана перевага).
Вважається лог-відношення правдоподібності (LLR).
Правила зупинки:- Якщо LLR ≥ (\ln\frac {1-\beta} {\alpha}) → прийняти (H_1) (перевага підтверджена) або вийти за метою.
- Якщо LLR ≤ (\ln\frac {\beta} {1-\alpha}) → прийняти (H_0) (переваги немає) і зупинитися.
- Інакше - продовжувати збирати спостереження.
Де корисно: при оцінці «жива/мертва» стратегія в лайві або за нових умов промо/коефів.
6) Три практичних «правила зупинки» (можна застосовувати разом)
1. Бар'єри результату (T/L):- Заздалегідь зафіксуйте ціль прибутку (+ T) і стоп-лосс (-L), узгоджені з бажаною ймовірністю успіху (\mathsf {P}) (формула в § 1). Досягли одного з бар'єрів - вихід.
- Після кожного блоку з (k) раундів перераховуйте ДІ/байєсівську ймовірність. Якщо довіри в EV> 0 недостатньо (ДІ включає 0 або (\mathsf {P} (EV\le 0 )\ge\tau)) - стоп.
- Якщо умовний RoR до кінця горизонту ≥ (\beta) або досягнутий ліміт допустимого осідання (наприклад, 20% для напів-Келлі) - стоп, навіть якщо мета не досягнута.
7) Міні-калькулятори (паперові)
A. підбір T/L під цільову ймовірність успіху
Введіть оцінку (p) (або діапазон).
Виберіть крок (\Delta) і цільові (M = L/\Delta), (N = T/\Delta).
Розрахуйте (\mathsf {P}) з формули § 1. Підберіть (M, N), щоб (\mathsf {P }\ge P_{\text{target}}) (наприклад, 60%).
Зафіксуйте бар'єри і не міняйте по ходу (інакше ламається математика зупинки).
B. перевірка впевненості в EV (частотний підхід)
Кожні (k) раундів будуйте 95% ДІ для (p).
Перерахуйте EV з урахуванням виплат і комісій.
Якщо верхня (для негативної гіпотези) або нижня (для позитивної) межа ДІ перетинає 0 - стоп/продовжити за правилом § 3.
С. Байєсовський тригер
Пріор (\text {Beta} (1,1)) (нейтральний) або інформативний.
Після кожного блоку оновлюйте постеріор і рахуйте (\mathsf {P} (EV\le 0)).
Поріг (\tau) беріть 0. 8–0. 9 для консервативної зупинки.
D. ризик розорення/осідання
Працюєте часткою від Келлі (f) (краще ⅓ - ½ Келлі).
Задайте максимальну допустиму просадку DD (_{\max}) (20-30%).
Якщо поточна DD ≥ DD (_{\max}) або умовний RoR ≥ (\beta) (наприклад, 5%) - стоп.
8) Типові сценарії та готові шаблони
Сценарій 1. Позитивний EV, висока волатильність (слоти, фриспіни)
(f\approx) ⅓ Келлі; бар'єри: (T = + 3\s\sigma) прибутку сесії, (L = -2\s\sigma).
Кожні 100-200 спінів - байєсівська перевірка (\mathsf {P} (EV\le 0)).
Будь-яка з трьох зупинок спрацьовує - вихід.
Сценарій 2. Ставки з перевагою за коефіцієнтами
Бар'єри по прибутку/збитку в одиницях ставки (наприклад, (T = + 10u), (L = -6u)).
SPRT с (\alpha=0. 1,\ \beta=0. 2) між (p_0) (без переваги) і (p_1) (очікуване).
Просадка 20% банку - технічна зупинка.
Сценарій 3. Тест нової стратегії
Мікро-ставки, обмежений банк тесту.
Кожні (k) подій - ДІ по (p); якщо ДІ включає нульовий EV → стоп, перегляд гіпотез.
9) Помилки, які ламають зупинку
Рух бар'єрів («посунемо стоп ще раз») - втрачається сенс імовірнісних гарантій.
Ігнор кореляцій (серії, залежність ринків) - переоцінка числа незалежних випробувань.
Зміна розміру ставки без перерахунку правил - змінюється дисперсія/EV, старі пороги невалідні.
Фіксація тільки на прибутку без метрик впевненості і RoR - високий шанс «догратися» до зайвого осідання.
10) Підсумок: проста формула процесу
1. До старту: задайте (T), (L), частоту перетестів (k), пороги (\tau) (для (\mathsf {P} (EV\le 0))), (\alpha ,\beta) (для SPRT), DD ({\max}), (\beta {\text {RoR}}).
2. У грі: після кожного кроку/блоку перевіряйте тригери (бар'єри, впевненість в EV, RoR/осідання).
3. При спрацьовуванні будь-якого тригера: зупинка без винятків.
4. Після сесії: лог - перерахунок (p, e ,\sigma), оновлення порогів.
Якщо дотримуватися цих правил, «момент зупинки за ймовірністю» перетворюється з інтуїтивної паузи в суворе управлінське рішення: ви припиняєте гру саме тоді, коли шанс несприятливого розвитку став статистично неприйнятним - і зберігаєте капітал і перевагу для наступних, більш якісних можливостей.
