Как определить момент остановки по вероятности
Зачем нужен «момент остановки по вероятности»
Остановка — это заранее определённое событие, при котором вы прекращаете игру/сессию, потому что вероятность неблагоприятного исхода превысила допустимый порог, либо, наоборот, цель достигнута. В отличие от эмоционального «хватит», вероятностная остановка опирается на:1. Барьеры результата (прибыль/просадка);
2. Оценку шансов (p, EV, дисперсия);
3. Риск-метрики (Risk of Ruin, вероятность ложного вывода, доверительные интервалы);
4. Тесты остановки (SPRT/байесовские правила).
1) Базовая модель: два поглощающих барьера (цель и стоп)
Представим капитал, меняющийся ступенями (ставка/раунд): вверх с вероятностью (p), вниз с вероятностью (q=1-p). Вводим два барьера: верхний (+T) (цель прибыли) и нижний (-L) (стоп-лосс). Как только капитал достигает одного из них — остановка.
Вероятность дойти до цели раньше стопа (класс «разорения игрока»)
Если шаги одинаковы по абсолютной величине и (p \ne q), то при старте на 0, с целями в шагах (N=T/\Delta) вверх и (M=L/\Delta) вниз:[
\mathsf{P}{\text{дойти до } +T};=; \frac{1-(q/p)^{M}}{1-(q/p)^{M+N}}
]При (p=q=0{.}5): (\mathsf{P}=\frac{M}{M+N}).
Правило: выбирайте (T) и (L) так, чтобы (\mathsf{P}) соответствовала вашей целевой вероятности успеха (например, ≥ 60%). Это — остановка по барьеру: достигли одного из уровней — выйти.
Практический вывод: при неблагоприятном (p \le 0.5) симметричные цели и стопы дают ≤50% успеха. Компенсировать можно только асимметрией барьеров (меньший стоп, большая цель) или фактическим (EV>0).
2) Остановка по риску разорения (RoR) к концу горизонта
Пусть у вас банк (B), ставка как доля (f), волатильность раунда (\sigma), преимущество (e) (ожидаемая доходность на раунд). Для конечного горизонта (N) вас интересует: «Каков шанс упасть ниже критического уровня (B_{\min}) до конца?» Если условный RoR при текущей просадке (DD) стал ≥ заданного порога (\beta) (например, 5%), останавливаемся.
Рабочая эвристика: если вы играете долей от Келли, то при падении в максимально допустимую просадку (например, 20–30% при полу-Келли) — остановка до восстановления параметров (пересчёт (p,e,\sigma), снижение (f)).
3) Остановка по доверительному интервалу для выигрыша/вероятности
Когда истинные шансы (p) неизвестны (слоты, лайв-рынки), вы обновляете оценку по наблюдениям. Пусть в бинарной абстракции за (n) попыток было (w) «успехов». Постройте двусторонний 95% ДИ для (p) (например, Клоппера–Пирсона). Если верхняя граница ДИ для вашего реального EV опускается ≤ 0, правило:Обратный вариант: если нижняя граница ДИ для (p) выше порога, который делает ваш EV > 0 — можно продолжать до ближайшего барьера прибыли/времени.
4) Байесовская остановка: «вероятность, что EV ≤ 0»
Задайте приор на (p) (бета-распределение (\text{Beta}(\alpha_0,\beta_0))). После (w) «успехов» в (n) испытаниях постериор (\text{Beta}(\alpha_0+w,\beta_0+n-w)). Пересчитайте постериорную вероятность гипотезы «(EV \le 0)» (с учётом коэффициентов выплат).
Правило: если (\mathsf{P}(EV\le 0\mid \text{данные}) \ge \tau) (например, 80–90%), — остановка.
Плюсы: плавное учётывание априорной информации, устойчивость на малых выборках.
5) Последовательный тест Вальда (SPRT) — «онлайн-решение»
SPRT проверяет (H_0) против (H_1) на лету, после каждого исхода. Вы задаёте приемлемые ошибки: (\alpha) (ложная тревога) и (\beta) (пропуск преимущества), и две гипотезы по (p):- (H_0:; p=p_0) (граница, где EV ≤ 0), (H_1:; p=p_1) (ожидаемое преимущество).
Считается лог-отношение правдоподобия (LLR).
Правила остановки:- Если LLR ≥ (\ln\frac{1-\beta}{\alpha}) → принять (H_1) (преимущество подтверждено) или выйти по цели.
- Если LLR ≤ (\ln\frac{\beta}{1-\alpha}) → принять (H_0) (преимущества нет) и остановиться.
- Иначе — продолжать собирать наблюдения.
Где полезно: при оценке «жива/мертва» стратегия в лайве или при новых условиях промо/коэфов.
6) Три практических «правила остановки» (можно применять вместе)
1. Барьеры результата (T/L):- Заранее зафиксируйте цель прибыли (+T) и стоп-лосс (-L), согласованные с желаемой вероятностью успеха (\mathsf{P}) (формула в §1). Достигли одного из барьеров — выход.
- После каждого блока из (k) раундов пересчитывайте ДИ/байесовскую вероятность. Если доверия в EV>0 недостаточно (ДИ включает 0 или (\mathsf{P}(EV\le 0)\ge\tau)) — стоп.
- Если условный RoR до конца горизонта ≥ (\beta) или достигнут лимит допустимой просадки (например, 20% для полу-Келли) — стоп, даже если цель не достигнута.
7) Мини-калькуляторы (бумажные)
A. Подбор T/L под целевую вероятность успеха
Введите оценку (p) (или диапазон).
Выберите шаг (\Delta) и целевые (M=L/\Delta), (N=T/\Delta).
Рассчитайте (\mathsf{P}) из формулы §1. Подберите (M,N), чтобы (\mathsf{P}\ge P_{\text{target}}) (например, 60%).
Зафиксируйте барьеры и не меняйте по ходу (иначе ломается математика остановки).
B. Проверка уверенности в EV (частотный подход)
Каждые (k) раундов стройте 95% ДИ для (p).
Пересчитайте EV с учётом выплат и комиссий.
Если верхняя (для отрицательной гипотезы) или нижняя (для положительной) граница ДИ пересекает 0 — стоп/продолжить по правилу §3.
C. Байесовский триггер
Приор (\text{Beta}(1,1)) (нейтральный) или информативный.
После каждого блока обновляйте постериор и считайте (\mathsf{P}(EV\le 0)).
Порог (\tau) берите 0.8–0.9 для консервативной остановки.
D. Риск разорения/просадки
Работаете долей от Келли (f) (лучше ⅓–½ Келли).
Задайте максимальную допустимую просадку DD(_{\max}) (20–30%).
Если текущая DD ≥ DD(_{\max}) или условный RoR ≥ (\beta) (напр., 5%) — стоп.
8) Типовые сценарии и готовые шаблоны
Сценарий 1. Положительный EV, высокая волатильность (слоты, фриспины)
(f \approx) ⅓ Келли; барьеры: (T=+3\s\sigma) прибыли сессии, (L=-2\s\sigma).
Каждые 100–200 спинов — байесовская проверка (\mathsf{P}(EV\le 0)).
Любая из трёх остановок срабатывает — выход.
Сценарий 2. Ставки с преимуществом по коэффициентам
Барьеры по прибыли/убытку в единицах ставки (например, (T=+10u), (L=-6u)).
SPRT с (\alpha=0.1,\ \beta=0.2) между (p_0) (без преимущества) и (p_1) (ожидаемое).
Просадка 20% банка — техническая остановка.
Сценарий 3. Тест новой стратегии
Микро-ставки, ограниченный банк теста.
Каждые (k) событий — ДИ по (p); если ДИ включает нулевой EV → стоп, пересмотр гипотез.
9) Ошибки, которые ломают остановку
Движение барьеров («подвинем стоп ещё разок») — теряется смысл вероятностных гарантий.
Игнор корреляций (серии, зависимость рынков) — переоценка числа независимых испытаний.
Смена размера ставки без пересчёта правил — меняется дисперсия/EV, старые пороги невалидны.
Фиксация только на прибыли без метрик уверенности и RoR — высокий шанс «доиграться» до лишней просадки.
10) Итог: простая формула процесса
1. До старта: задайте (T), (L), частоту перетестов (k), пороги (\tau) (для (\mathsf{P}(EV\le 0))), (\alpha,\beta) (для SPRT), DD({\max}), (\beta{\text{RoR}}).
2. В игре: после каждого шага/блока проверяйте триггеры (барьеры, уверенность в EV, RoR/просадка).
3. При срабатывании любого триггера: остановка без исключений.
4. После сессии: лог — пересчёт (p,e,\sigma), обновление порогов.
Если придерживаться этих правил, «момент остановки по вероятности» превращается из интуитивной паузы в строгое управленческое решение: вы прекращаете игру именно тогда, когда шанс неблагоприятного развития стал статистически неприемлемым — и сохраняете капитал и преимущество для следующих, более качественных возможностей.
