Como analisar séries ganhadoras
«A Série Vencedora» é um êxito (hits) de sucesso em sequência entre as duas incoerências. Em um jogo honesto (costas independentes), as séries são naturais: o acaso gera clusters. Analisar bem as séries ajuda a entender o perfil de risco (com que frequência «vai») e ajustar os limites. Ele não prevê o próximo spin.
1) Modelo básico: Bernoulli e geometria de série
Que cada spin seja um teste independente com probabilidade de sucesso (p) (por exemplo, «qualquer ganho» ou «ganho significativo ≥×10»).
O comprimento da série vencedora (K\ge1) até a primeira derrota foi distribuído geometricamente:[
\mathbb{P}(K=k)=(1-p),p^{k-1},\quad \mathbb{E}[K]=\frac{1}{1-p},\quad \mathrm{Med}(K)\approx \left\lceil \frac{\ln 0. 5}{\ln p}\right\rceil.
]Probabilidade de uma série de comprimento de (k): (\mathbb\P 03 (K\ge k) = p ^, k-1).
Número esperado de séries (todos os comprimentos) por (N) spin ≈ (N (1-p)).
Número esperado de séries de ≥ (k) por (N) spin ≈ (N (1-p), p ^, k-1).
2) O que medir exatamente em seus logs
Primeiro, defina o que considerar um sucesso:- «qualquer ganho» (HF), ou
- «significativo» (limiar, por exemplo, ≥×5/×10), ou
- «spin pro» (pagamento ≥ taxa).
1. HF (p): proporção de spins bem sucedidos.
2. A lista de longas de série de ganhos é (K _ 1, K _ 2 ,\dots) (e separadamente para «significativos»).
3. Quantili comprimentos de série, mediana, 75, 90.
4. Série máxima (Max W-streak) no segmento (N).
5. O número de séries (k) para várias liminares (k) (por exemplo, , ).
6. As estatísticas de série perdida (L-streak) são simétricas, e isso é importante para os lossos parados nas costas.
3) Interpretação rápida de números
Se as frequências observadas (# K\ge k )/#\text se aproximarem de (p ^ se), o comportamento é como um comportamento independente.
Desvios em amostras curtas são normais. Veja os intervalos de indefinição (por lista (K _ i)) e/ou simulação.
Max W-streak cresce logaritmicamente por (N): as séries «bonitas» são longas mesmo com uma pequena (p).
Um mini-exemplo. Deixe o HF (p = 0, 30). Então:- (\mathbb{P}(K\ge3)=p^2=0{,}09); (N = 1000) espins aguardamos (\approx N (1-p) p ^\2 f.\approx 630\times0, <09\approx 57) séries de ≥3. Para ≥6: (p ^\5 03\approx 0 <, <00243), ⇒ ≈ (630\times0\, a.00243\approx 1, a.5) séries é raro, mas não é um milagre.
4) Verificações de hipóteses: «As séries não estão superestimadas?»
Use uma ou mais ferramentas:1. Comparação com a geometria.
Avalie (p =\widehat\HF f.).
Construa teóricos (\mathbb\P f. (K\ge k) = p ^ k-1) e compare com empírico.
Adicione as faixas de confiança (butstrap) para as participações observadas.
2. Teste de Valda-Wolfowitz.
Classifique as costas como um sucesso/inconveniente.
Compare o número de «séries» (runs) com o esperado para a independência.
Desvios significativos podem indicar dependência (ou apenas uma amostra pequena).
3. Monte Carlo a zero.
Com (p) fixo, simule milhares de sequências de comprimento (N).
Veja a distribuição do Max W-streak e o número de séries ≥ (k).
Compare suas observações com esta distribuição (p-valor «incomum ou não»).
5) Prática: como fazer os cálculos (sem código)
1. Junte o logo: número de costas, resultado (desenho animado), bandeiras binárias de sucesso, sucesso significativo.
2. Acesse a coluna de êxito e produza os comprimentos de série (contagem, largada no 0 quando não estiver disponível).
3. Calcule:- (p =) média por bandeira de sucesso;
- quantili (K);
- – Max W-streak;
- Frequências (# K\ge k) para (k = 2.. 7).
- 4. Construa a teoria de (p ^\k-1) e o número esperado de séries de ≥ (k): (N (1-p) p ^\k-1).
- 5. Faça uma simulação de zero (pelo menos 10k upons) - distribuição de Max W-streak e número de séries de ≥ (k).
- 6. Compare e conclusão: «Dentro das expectativas »/« acima das expectativas, mas encaixado em barras de confiança »/« desconfiado - falta de dados».
6) Armadilhas típicas
Seleção seletiva da janela. Levamos um bom período. As séries parecem mágicas. Use comprimento fixo de janela (por exemplo, batches de 1.000 spins).
Mudança de critérios de sucesso no voo. Primeiro decida o que é «sucesso» e não mude o resultado.
Uma confusão de «série de ganhos» e «série de spins». São binários diferentes (HF vs «pagamento ≥ taxa»).
Interpretação como previsão. Os episódios descrevem o padrão mais recente sem informar nada sobre as próximas costas (independência).
7) Como usar séries em gerenciamento de risco
Limites nas costas. Conhecendo o quantili das séries perdedoras (L-streak), defina o tempo após a L≥k.
O plano do banco. Se a série vencedora mediana for curta e «significativa» rara, conte com o banco para «desertos».
Comprimento da sessão. A probabilidade de encontrar uma série (k) cresce com (N). Se o seu objetivo for «capturar ≥×10», avalie (q =\mathbb\P 03 (\ text{≥×10 por spin 03) e use (\mathbb\P) (\text\não capturar por 03 N) = (1-q) ^ N).
Desligar o dogão. As séries não oferecem vantagem para aumentar a taxa - é apenas uma forma de dispersão.
8) Mini-modelo para seus artigos/relatórios
Critério de sucesso (qualquer ganho/ ≥×10/spin mais)
HF (nota (p)):...
Quantili de comprimento de série W: mediana...; 75...; 90...
Número de séries ≥3/ ≥5/ ≥6: fato .../.../...; espera (N (1-p) p ^\k-1) .../.../...
Max W-streak: fato...; faixa de simulação (Q5-Q95):... -...
Conclusão: Correspondência do modelo/necessita de mais dados; recomendação de limites.
9) Pequenos pontos de referência (para calibrar a intuição)
Com HF (p = 0 25): série W mediana ≈ 1-2, (\mathbb\P f. (K\ge5) = p ^\ 4 <\approx 0 39%). Para (N = 2000) spin, espera por séries de ≥5: (\approx 1500\times0 ,\0039\approx 6).
Em um evento raro (q = 1%) (por exemplo, ≥×10): comprimento mediano de «série de significados» = 1 (raramente 2 + consecutivos), e as distâncias entre essas costas são grandes; a análise de episódios é mais útil em termos de «pausas entre eventos» do que «consecutivos».
10) Folha de cheque curto analista
Descobri os critérios de sucesso?
O comprimento da janela e o volume de dados são suficientes (batch, mais de um teste)?
Comparou com a geometria e Monte Carlo sob o mesmo (p)?
Mostrou quantili e Max W-streak com faixas de confiança?
As conclusões são sobre gerenciamento de risco, não sobre «timing»?
As séries vencedoras são a forma normal de um acidente. Sua análise é trabalhar com uma distribuição geométrica e comparar observações com um modelo zero (e/ou simulação), em vez de procurar um «relógio quente». Em números cinzentos - HF, quantilhas de comprimento, número esperado de séries e distribuição da série máxima - você se arma para planejar o banco, durar a sessão e os limites, mantendo-se dentro da matemática justa, em vez de superstições.
