Как определить момент остановки по вероятности

Зачем нужен «момент остановки по вероятности»

Остановка — это заранее определённое событие, при котором вы прекращаете игру/сессию, потому что вероятность неблагоприятного исхода превысила допустимый порог, либо, наоборот, цель достигнута. В отличие от эмоционального «хватит», вероятностная остановка опирается на:

1. Барьеры результата (прибыль/просадка);

2. Оценку шансов (p, EV, дисперсия);

3. Риск-метрики (Risk of Ruin, вероятность ложного вывода, доверительные интервалы);

4. Тесты остановки (SPRT/байесовские правила).

1) Базовая модель: два поглощающих барьера (цель и стоп)

Представим капитал, меняющийся ступенями (ставка/раунд): вверх с вероятностью (p), вниз с вероятностью (q=1-p). Вводим два барьера: верхний (+T) (цель прибыли) и нижний (-L) (стоп-лосс). Как только капитал достигает одного из них — остановка.

Вероятность дойти до цели раньше стопа (класс «разорения игрока»)

Если шаги одинаковы по абсолютной величине и (p \ne q), то при старте на 0, с целями в шагах (N=T/\Delta) вверх и (M=L/\Delta) вниз:

[
\mathsf{P}{\text{дойти до } +T};=; \frac{1-(q/p)^{M}}{1-(q/p)^{M+N}}
]

При (p=q=0{.}5): (\mathsf{P}=\frac{M}{M+N}).

Правило: выбирайте (T) и (L) так, чтобы (\mathsf{P}) соответствовала вашей целевой вероятности успеха (например, ≥ 60%). Это — остановка по барьеру: достигли одного из уровней — выйти.

Практический вывод: при неблагоприятном (p \le 0.5) симметричные цели и стопы дают ≤50% успеха. Компенсировать можно только асимметрией барьеров (меньший стоп, большая цель) или фактическим (EV>0).

2) Остановка по риску разорения (RoR) к концу горизонта

Пусть у вас банк (B), ставка как доля (f), волатильность раунда (\sigma), преимущество (e) (ожидаемая доходность на раунд). Для конечного горизонта (N) вас интересует: «Каков шанс упасть ниже критического уровня (B_{\min}) до конца?» Если условный RoR при текущей просадке (DD) стал ≥ заданного порога (\beta) (например, 5%), останавливаемся.

Рабочая эвристика: если вы играете долей от Келли, то при падении в максимально допустимую просадку (например, 20–30% при полу-Келли) — остановка до восстановления параметров (пересчёт (p,e,\sigma), снижение (f)).

3) Остановка по доверительному интервалу для выигрыша/вероятности

Когда истинные шансы (p) неизвестны (слоты, лайв-рынки), вы обновляете оценку по наблюдениям. Пусть в бинарной абстракции за (n) попыток было (w) «успехов». Постройте двусторонний 95% ДИ для (p) (например, Клоппера–Пирсона). Если верхняя граница ДИ для вашего реального EV опускается ≤ 0, правило:

💡 Стоп, потому что при текущих данных даже благоприятная оценка не подтверждает положительное ожидание с достаточной уверенностью.

Обратный вариант: если нижняя граница ДИ для (p) выше порога, который делает ваш EV > 0 — можно продолжать до ближайшего барьера прибыли/времени.

4) Байесовская остановка: «вероятность, что EV ≤ 0»

Задайте приор на (p) (бета-распределение (\text{Beta}(\alpha_0,\beta_0))). После (w) «успехов» в (n) испытаниях постериор (\text{Beta}(\alpha_0+w,\beta_0+n-w)). Пересчитайте постериорную вероятность гипотезы «(EV \le 0)» (с учётом коэффициентов выплат).

Правило: если (\mathsf{P}(EV\le 0\mid \text{данные}) \ge \tau) (например, 80–90%), — остановка.

Плюсы: плавное учётывание априорной информации, устойчивость на малых выборках.

5) Последовательный тест Вальда (SPRT) — «онлайн-решение»

SPRT проверяет (H_0) против (H_1) на лету, после каждого исхода. Вы задаёте приемлемые ошибки: (\alpha) (ложная тревога) и (\beta) (пропуск преимущества), и две гипотезы по (p):

(H_0:; p=p_0) (граница, где EV ≤ 0), (H_1:; p=p_1) (ожидаемое преимущество).

Считается лог-отношение правдоподобия (LLR).

Правила остановки:

Если LLR ≥ (\ln\frac{1-\beta}{\alpha}) → принять (H_1) (преимущество подтверждено) или выйти по цели.
Если LLR ≤ (\ln\frac{\beta}{1-\alpha}) → принять (H_0) (преимущества нет) и остановиться.
Иначе — продолжать собирать наблюдения.

Где полезно: при оценке «жива/мертва» стратегия в лайве или при новых условиях промо/коэфов.

6) Три практических «правила остановки» (можно применять вместе)

1. Барьеры результата (T/L):

Заранее зафиксируйте цель прибыли (+T) и стоп-лосс (-L), согласованные с желаемой вероятностью успеха (\mathsf{P}) (формула в §1). Достигли одного из барьеров — выход.

2. Правило уверенности в EV:

После каждого блока из (k) раундов пересчитывайте ДИ/байесовскую вероятность. Если доверия в EV>0 недостаточно (ДИ включает 0 или (\mathsf{P}(EV\le 0)\ge\tau)) — стоп.

3. Правило риска разорения:

Если условный RoR до конца горизонта ≥ (\beta) или достигнут лимит допустимой просадки (например, 20% для полу-Келли) — стоп, даже если цель не достигнута.

7) Мини-калькуляторы (бумажные)

A. Подбор T/L под целевую вероятность успеха

Введите оценку (p) (или диапазон).

Выберите шаг (\Delta) и целевые (M=L/\Delta), (N=T/\Delta).

Рассчитайте (\mathsf{P}) из формулы §1. Подберите (M,N), чтобы (\mathsf{P}\ge P_{\text{target}}) (например, 60%).

Зафиксируйте барьеры и не меняйте по ходу (иначе ломается математика остановки).

B. Проверка уверенности в EV (частотный подход)

Каждые (k) раундов стройте 95% ДИ для (p).

Пересчитайте EV с учётом выплат и комиссий.

Если верхняя (для отрицательной гипотезы) или нижняя (для положительной) граница ДИ пересекает 0 — стоп/продолжить по правилу §3.

C. Байесовский триггер

Приор (\text{Beta}(1,1)) (нейтральный) или информативный.

После каждого блока обновляйте постериор и считайте (\mathsf{P}(EV\le 0)).

Порог (\tau) берите 0.8–0.9 для консервативной остановки.

D. Риск разорения/просадки

Работаете долей от Келли (f) (лучше ⅓–½ Келли).

Задайте максимальную допустимую просадку DD(_{\max}) (20–30%).

Если текущая DD ≥ DD(_{\max}) или условный RoR ≥ (\beta) (напр., 5%) — стоп.

8) Типовые сценарии и готовые шаблоны

Сценарий 1. Положительный EV, высокая волатильность (слоты, фриспины)

(f \approx) ⅓ Келли; барьеры: (T=+3\s\sigma) прибыли сессии, (L=-2\s\sigma).

Каждые 100–200 спинов — байесовская проверка (\mathsf{P}(EV\le 0)).

Любая из трёх остановок срабатывает — выход.

Сценарий 2. Ставки с преимуществом по коэффициентам

Барьеры по прибыли/убытку в единицах ставки (например, (T=+10u), (L=-6u)).

SPRT с (\alpha=0.1,\ \beta=0.2) между (p_0) (без преимущества) и (p_1) (ожидаемое).

Просадка 20% банка — техническая остановка.

Сценарий 3. Тест новой стратегии

Микро-ставки, ограниченный банк теста.

Каждые (k) событий — ДИ по (p); если ДИ включает нулевой EV → стоп, пересмотр гипотез.

9) Ошибки, которые ломают остановку

Движение барьеров («подвинем стоп ещё разок») — теряется смысл вероятностных гарантий.

Игнор корреляций (серии, зависимость рынков) — переоценка числа независимых испытаний.

Смена размера ставки без пересчёта правил — меняется дисперсия/EV, старые пороги невалидны.

Фиксация только на прибыли без метрик уверенности и RoR — высокий шанс «доиграться» до лишней просадки.

10) Итог: простая формула процесса

1. До старта: задайте (T), (L), частоту перетестов (k), пороги (\tau) (для (\mathsf{P}(EV\le 0))), (\alpha,\beta) (для SPRT), DD({\max}), (\beta{\text{RoR}}).

2. В игре: после каждого шага/блока проверяйте триггеры (барьеры, уверенность в EV, RoR/просадка).

3. При срабатывании любого триггера: остановка без исключений.

4. После сессии: лог — пересчёт (p,e,\sigma), обновление порогов.

Если придерживаться этих правил, «момент остановки по вероятности» превращается из интуитивной паузы в строгое управленческое решение: вы прекращаете игру именно тогда, когда шанс неблагоприятного развития стал статистически неприемлемым — и сохраняете капитал и преимущество для следующих, более качественных возможностей.