Cómo analizar las series ganadoras
La «racha ganadora» es una serie consecutiva de exitosos desenlaces (hits) entre dos fracasos. En juego limpio (giros independientes), las series son naturales: el azar genera racimos. El análisis competente de la serie ayuda a comprender el perfil de riesgo (con qué frecuencia «va») y a establecer límites. No está prediciendo la próxima vuelta.
1) Modelo básico: Bernoulli y geometría de serie
Que cada giro sea una prueba independiente con probabilidad de éxito (p) (por ejemplo, «cualquier ganancia» o «ganancia significativa ≥×10»).
La longitud de la serie ganadora (K\ge1) hasta la primera pérdida se distribuye geométricamente:[
\mathbb{P}(K=k)=(1-p),p^{k-1},\quad \mathbb{E}[K]=\frac{1}{1-p},\quad \mathrm{Med}(K)\approx \left\lceil \frac{\ln 0. 5}{\ln p}\right\rceil.
]Probabilidad de serie de longitud ≥ (k): (\mathbb {P} (K\ge k) = p ^ {, k-1}).
Número esperado de series (todas las longitudes) por (N) giros ≈ (N (1-p)).
Número esperado de series de ≥ (k) por (N) giros ≈ (N (1-p), p ^ {, k-1}).
2) Qué medir exactamente en sus logotipos
Primero, determine qué considerar éxito:- «cualquier ganancia» (HF), o
- «significativo» (umbral, por ejemplo, ≥×5/×10), o
- «plusvalía» (pago ≥ apuesta).
1. HF (puntuación (p)): proporción de giros exitosos.
2. Lista de longitudes de series ganadoras: (K_1,K_2,\dots) (y por separado - para «significativas»).
3. Cuantiles de longitudes de serie: mediana, 75, 90 percentili.
4. Serie máxima (Max W-streak) en el segmento (N).
5. Número de series ≥ (k) para varios umbrales (k) (por ejemplo, ≥3, ≥5).
6. Las estadísticas de las series perdedoras (L-streak) son simétricas, esto es importante para los stop loss de espalda.
3) Interpretación rápida de los dígitos
Si las frecuencias observadas (# {K\ge k }/#\text {series}) son cercanas (p ^ {k-1}), el comportamiento es similar al independiente.
Las desviaciones en muestras cortas son la norma. Vea los intervalos de incertidumbre (bootstrap por lista (K_i)) y/o simulación.
Max W-streak crece logarítmicamente por (N): las series largas «hermosas» son incluso con un pequeño (p).
Mini ejemplo. HF (p = 0 {,} 30). Entonces:- (\mathbb{P}(K\ge3)=p^2=0{,}09); en (N = 1000) esperas giros (\approx N (1-p) p ^ {2 }\approx 630\times0 {,} 09\approx 57) series ≥3. Para ≥6: (p ^ {5 }\approx 0 {,} 00243) ⇒ ≈ (630\times0 {,} 00243\approx 1 {,} 5) series son raras, pero no un milagro.
4) Verificaciones de hipótesis: «¿No se sobreestiman las series?»
Utilice una o más herramientas:1. Comparación con geometría.
Evaluar (p =\widehat {HF}).
Construya teóricos (\mathbb {P} (K\ge k) = p ^ {k-1}) y compare con empíricos.
Añadir bandas de confianza (bootstrap) para los lóbulos observados.
2. Prueba de Wald-Wolfowitz (prueba runs).
Clasificar las espaldas como éxito/fracaso.
Compare el número de «series» (runs') con el esperado con independencia.
Las desviaciones significativas pueden indicar una dependencia (o simplemente una muestra pequeña).
3. Monte Carlo está bajo cero.
Con fijo (p) simule miles de secuencias de longitud (N).
Vea la distribución de Max W-streak y el número de series de ≥ (k).
Compare sus observaciones con esta distribución (valor p «demasiado inusual o no»).
5) Práctica: cómo hacer cálculos (sin código)
1. Recopilar el registro: el número de vuelta, el resultado (multiplicador), las banderas binarias «éxito», «éxito significativo».
2. Corre a través de la columna de éxitos y forma las longitudes de la serie (contador, restablecer a 0 en caso de fracaso).
3. Calcular:- (p =) promedio en la bandera del éxito;
- Cuantili (K);
- – Max W-streak;
- frecuencias (# {K\ge k}) para (k = 2.. 7).
- 4. Construya la teoría: (p ^ {k-1}) y el número esperado de series ≥ (k): (N (1-p) p ^ {k-1}).
- 5. Hacer una simulación de cero (al menos 10k carreras) - la distribución de Max W-streak y el número de series ≥ (k).
- 6. Compare también la conclusión: «Dentro de las expectativas »/« por encima de las expectativas, pero encajado en las bandas de confianza »/« sospechosamente - faltan datos».
6) Trampas típicas
Selección selectiva de la ventana. Tomaron un período «exitoso» - las series parecen ser magia. Use una longitud de ventana fija (por ejemplo, batches de 1000 giros).
Cambio de criterios de éxito sobre la marcha. Primero decide qué es el «éxito» y no cambies por el resultado.
Confusión entre la «serie de victorias» y la «serie de giros pluses». Se trata de diferentes binarizaciones (HF vs «pago ≥ apuesta»).
Interpretación como predicción. Las series describen un patrón pasado sin reportar nada sobre la siguiente espalda (independencia).
7) Cómo utilizar la serie en la gestión de riesgos
Límites de espalda. Conociendo los cuantiles de las series perdedoras (L-streak), establece un «tiempo de espera después de la L≥k».
El plan del banco. Si la serie ganadora mediana es corta y la «significativa» es rara, cuenta el banco con «desiertos».
Duración de la sesión. La probabilidad de encontrarse con una serie de ≥ (k) crece con (N). Si su objetivo es «atrapar ≥×10», evalúe (q =\mathbb {P} (\ text{≥×10 por giro})) y utilice (\mathbb {P} (\text {no atrapar por} N) = (1-q) ^ N).
Desactivar el dogón. Las series no ofrecen ventajas para aumentar la tasa - es simplemente una forma de varianza.
8) Mini plantilla para sus artículos/informes
Criterio de éxito: (cualquier ganancia/ ≥×10/plusvalía)
HF (puntuación (p)): ...%
Cuantiles de longitud de serie W: mediana...; 75... El 90...
Número de series ≥3/ ≥5/ ≥6: hecho .../.../...; espera (N (1-p) p ^ {k-1}) .../.../...
Max W-streak: hecho...; rango de simulación (Q5-Q95):... -...
Salida: la conformidad del modelo/requiere más datos; Recomendaciones de límites.
9) Pequeños puntos de referencia (para calibrar la intuición)
En HF (p = 0 {,} 25): serie W mediana ≈ 1-2, (\mathbb {P} (K\ge5) = p ^ {4 }\approx 0 {,} 39%). En (N = 2000) giros, espera series ≥5: (\approx 1500\times0 {,} 0039\approx 6).
En un evento raro (q = 1%) (por ejemplo, ≥×10): longitud mediana de la «serie significativa» = 1 (raramente hay 2 + seguidas), y las distancias entre tales giros son grandes; el análisis de series es más útil en términos de «pausa entre eventos» que de «seguidas».
10) Short Check-List Analytics
¿He establecido claramente el criterio de éxito?
¿La longitud de la ventana y la cantidad de datos son suficientes (batchs, más de una carrera)?
Comparado con la geometría y Monte Carlo bajo el mismo (p)?
¿Mostró los cuantiles y Max W-streak con bandas de confianza?
¿Las conclusiones se refieren a la gestión del riesgo y no al «timing» de la apuesta?
En pocas palabras: las series ganadoras son la forma normal de manifestación del azar. Su análisis es trabajar con la distribución geométrica y comparar las observaciones con el modelo cero (y/o simulación) en lugar de buscar el «reloj caliente». En números grises - HF, cuantiles de longitud, el número esperado de series y la distribución de la serie máxima - te armas para planificar el banco, la duración de la sesión y los límites, permaneciendo dentro de las matemáticas honestas y no de las supersticiones.
