Cómo determinar el momento de parada por probabilidad

¿Por qué se necesita un «momento de paralización por probabilidad»?

Una parada es un evento predeterminado en el que se detiene el juego/sesión porque la probabilidad de un resultado adverso ha superado el umbral permitido o, por el contrario, se ha alcanzado el objetivo. A diferencia del «suficiente» emocional, la parada probabilística se apoya en:

1. Barreras de resultado (beneficio/reducción);

2. Evaluación de probabilidades (p, EV, varianza);

3. Métricas de riesgo (Risk of Ruin, probabilidad de salida falsa, intervalos de confianza);

4. Pruebas de parada (SPRT/Bayesian Rules).

1) Modelo básico: dos barreras de absorción (objetivo y parada)

Imaginemos un capital que cambia de escalón (apuesta/ronda): arriba con probabilidad (p), abajo con probabilidad (q = 1-p). Introducimos dos barreras: la superior (+ T) (objetivo de beneficio) y la inferior (-L) (stop-loss). Una vez que el capital llega a uno de ellos - parada.

Probabilidad de llegar al objetivo antes del pie (clase de «ruina del jugador»)

Si los pasos son los mismos en valor absoluto y (p\ne q), entonces al iniciar en 0, con los objetivos en pasos (N = T/\Delta) hacia arriba y (M = L/\Delta) hacia abajo:

[
\ mathsf {P} {\text {alcanzar} + T}; = ;\frac {1- (q/p) ^ {M}} {1- (q/p) ^ {M + N}}}
]

При (p=q=0{.}5): (\mathsf{P}=\frac{M}{M+N}).

Regla: seleccione (T) y (L) para que (\mathsf {P}) coincida con su probabilidad de éxito objetivo (por ejemplo, ≥ del 60%). Esto es una parada en la barrera: han alcanzado uno de los niveles - salir.

Conclusión práctica: cuando es desfavorable (p\le 0. 5) objetivos y pies simétricos dan ≤50% de éxito. Sólo se puede compensar con una asimetría de barreras (parada más pequeña, objetivo más grande) o real (EV> 0).

2) Parada por riesgo de ruina (RoR) hacia el final del horizonte

Que tengas un banco (B), una apuesta como participación (f), volatilidad de la ronda (\sigma), una ventaja (e) (rendimiento esperado por ronda). Para el horizonte final (N) te interesa: «¿Cuál es la posibilidad de caer por debajo del nivel crítico (B_{\min}) hasta el final?» Si el RoR condicional en la reducción actual (DD) se ha convertido en el ≥ del umbral especificado (\beta) (por ejemplo, 5%), se detiene.

Heurística de trabajo: si juegas con una fracción de Kelly, entonces cuando caes a la reducción máxima permitida (por ejemplo, 20-30% en semi-Kelly) - detener hasta que se restablezcan los parámetros (recuento (p, e ,\sigma), disminución (f)).

3) Parada en el intervalo de confianza para ganar/probabilidad

Cuando las probabilidades verdaderas (p) son desconocidas (ranuras, mercados en vivo), actualiza la evaluación por observaciones. Que en la abstracción binaria para (n) intentos haya (w) «éxitos». Construya un IC bilateral del 95% para (p) (por ejemplo, Clopper-Pearson). Si el límite superior del IC para su EV real se omite ≤ 0, la regla es:

💡 Stop, porque con los datos actuales, ni siquiera una evaluación favorable confirma una expectativa positiva con suficiente confianza.

Opción inversa: si el límite inferior del IC para (p) está por encima del umbral que hace que su EV> 0 - puede continuar hasta la barrera de beneficio/tiempo más cercana.

4) Parada bayesiana: «probabilidad de que EV ≤ 0»

Establezca el prior en (p) (distribución beta (\text {Beta} (\alpha _ 0 ,\beta _ 0)). Después de (w) «aciertos» en (n) pruebas de posterior (\text {Beta} (\alpha _ 0 + w ,\beta _ 0 + n-w)). Volver a calcular la probabilidad posterior de la hipótesis «(EV\le 0)» (teniendo en cuenta los coeficientes de pago).

Regla: si (\mathsf {P} (EV\le 0\mid\text {datos} )\ge\tau) (por ejemplo, 80-90%), se detiene.

Pros: contabilización fluida de la información a priori, sostenibilidad en muestras pequeñas.

5) Prueba de Wald secuencial (SPRT) - «solución en línea»

El SPRT comprueba (H_0) contra (H_1) sobre la marcha, después de cada desenlace. Se establecen errores aceptables: (\alpha) (falsa alarma) y (\beta) (omisión de ventaja), y dos hipótesis por (p):

(H_0:; p = p _ 0) (límite donde EV ≤ 0), (H_1:; p = p _ 1) (ventaja esperada).

Se considera una relación de registro de plausibilidad (LLR).

Reglas de detención:

Si LLR ≥ (\ln\frac {1-\beta} {\alpha}) → aceptar (H_1) (ventaja confirmada) o salir del objetivo.
Si LLR ≤ (\ln\frac {\beta} {1-\alpha}) → aceptar (H_0) (no hay beneficios) y detenerse.
De lo contrario, seguir recogiendo observaciones.

Donde es útil: cuando se evalúa una estrategia «viva/muerta» en lives o bajo las nuevas condiciones de promo/oho.

6) Tres «reglas de detención» prácticas (se pueden aplicar conjuntamente)

1. Obstáculos al resultado (T/L):

Fije de antemano el objetivo de beneficio (+ T) y el stop-loss (-L) alineados con la probabilidad de éxito deseada (\mathsf {P}) (fórmula en § 1). Han alcanzado una de las barreras: la salida.

2. Regla de confianza en EV:

Después de cada bloque de (k) rondas, vuelva a calcular el DI/probabilidad bayesiana. Si la confianza en EV> 0 no es suficiente (el IC incluye 0 o (\mathsf {P} (EV\le 0 )\ge\tau)) - stop.

3. Regla de riesgo de ruina:

Si el RoR condicional llega hasta el final del horizonte ≥ (\beta) o alcanza el límite de reducción admisible (por ejemplo, 20% para semi-Kelly) - stop, incluso si no se ha alcanzado el objetivo.

7) Mini calculadoras (de papel)

A. Selección de T/L para la probabilidad de éxito objetivo

Introduzca una puntuación (p) (o rango).

Seleccione el paso (\Delta) y el destino (M = L/\Delta), (N = T/\Delta).

Calcule (\mathsf {P}) a partir de la fórmula § 1. Seleccione (M, N) para (\mathsf {P }\ge P_{\text{target}}) (por ejemplo, 60%).

Fije las barreras y no cambie en el curso (de lo contrario se rompe la matemática de la parada).

B. Verificación de la confianza en EV (enfoque de frecuencia)

Cada (k) rondas, construya un IC del 95% para (p).

Vuelva a calcular el EV teniendo en cuenta los pagos y las comisiones.

Si el límite superior (para hipótesis negativa) o inferior (para positivo) del IC cruza 0 - parar/continuar por regla § 3.

C. El desencadenante bayesiano

Prior (\text {Beta} (1,1)) (neutral) o informativo.

Después de cada bloque, actualice el posterior y lea (\mathsf {P} (EV\le 0)).

El umbral (\tau) toma 0. 8–0. 9 para una parada conservadora.

D. Riesgo de ruina/reducción

Trabaje con una fracción de Kelly (f) (mejor ⅓ - ½ Kelly).

Especifique la reducción DD (_{\max}) máxima permitida (20-30%).

Si el DD ≥ DD (_{\max}) actual o el RoR condicional ≥ (\beta) (por ejemplo, 5%) es stop.

8) Scripts estándar y plantillas terminadas

Escenario 1. EV positivo, alta volatilidad (ranuras, frisones)

(f\approx) ⅓ Kelly; barreras: (T = + 3\s\sigma) sesión de ganancias, (L = -2\s\sigma).

Cada 100-200 giros es una comprobación bayesiana (\mathsf {P} (EV\le 0)).

Cualquiera de las tres paradas se dispara - salida.

Escenario 2. Apuestas con ventaja por coeficientes

Barreras de ganancia/pérdida en unidades de tipos (por ejemplo, (T = + 10u), (L = -6u)).

SPRT с (\alpha=0. 1,\ \beta=0. 2) entre (p_0) (sin beneficio) y (p_1) (esperado).

La reducción del 20% del banco es una parada técnica.

Escenario 3. Prueba de la nueva estrategia

Micro-apuestas, banco de pruebas limitado.

Cada (k) evento - IC por (p); si el IC incluye un EV cero → parada, revisión de hipótesis.

9) Errores que rompen la parada

Movimiento de las barreras («movamos el pie una y otra vez») - se pierde el sentido de las garantías probabilísticas.

Ignorar las correlaciones (series, dependencia de los mercados) es revalorizar el número de ensayos independientes.

Cambio en el tamaño de la apuesta sin volver a calcular las reglas - la varianza/EV cambia, los antiguos umbrales son inválidos.

Fijarse solo en las ganancias sin métricas de confianza y RoR es una alta posibilidad de «terminar» con una reducción innecesaria.

10) Resultado: fórmula de proceso simple

1. Antes del inicio: especifique (T), (L), frecuencia de transferencia (k), umbrales (\tau) (para (\mathsf {P} (EV\le 0))), (\alpha ,\beta) (para SPRT), DD ({\max}), (\beta {\text {RoR}}).

2. En el juego: después de cada paso/bloque, compruebe los disparadores (barreras, confianza en EV, RoR/reducción).

3. Cuando se activa cualquier disparador: detener sin excepciones.

4. Después de la sesión: registro - recuento (p, e ,\sigma), actualización de umbrales.

Si nos atenemos a estas reglas, el «momento de paralización por probabilidad» pasa de una pausa intuitiva a una decisión de gestión estricta: dejas de jugar precisamente cuando la posibilidad de un desarrollo adverso se ha vuelto estadísticamente inaceptable - y conservas el capital y la ventaja para las siguientes, mejores oportunidades.