Come analizzare le serie vincenti

«La serie vincente» è un successo (hit) consecutivo tra due insuccessi. In un gioco onesto (schiena indipendente), le serie sono naturali: la casualità genera cluster. L'analisi corretta delle serie consente di comprendere il profilo di rischio (quanto spesso «va») e di impostare i limiti. Non ha previsto il prossimo spin.

1) Modello base: Bernulli e geometria serie

Che ogni spin sia una prova indipendente con probabilità di successo (ad esempio, «qualsiasi vincita» o «vincita importante»).

La lunghezza della serie vincente (K\ge1) fino alla prima perdita è distribuita geometricamente:

[
\mathbb{P}(K=k)=(1-p),p^{k-1},\quad \mathbb{E}[K]=\frac{1}{1-p},\quad \mathrm{Med}(K)\approx \left\lceil \frac{\ln 0. 5}{\ln p}\right\rceil.
]

La probabilità di una serie di ≥ (k) è (\mathbb {P} (K\ge k) = p ^ {, k-1}).

Numero previsto di serie (tutte le lunghezze) per (N) spin ≈ (N (1-p)).

Numero previsto di serie di ≥ (k) per (N) spin ≈ (N (1-p), p ^ {, k-1}).

💡 Se «successo» è un evento raro (ad esempio, con probabilità (q)), basta incastrare (p = q) - funziona sempre di più per queste serie «significative».

2) Cosa misurare esattamente sui vostri cassetti

Prima di tutto, determinate cosa considerare un successo:

«qualsiasi vincita» (HF), o
«rilevante» (soglia, ad esempio, ≥×5/×10), o
«spin plush».

Poi contate:

1. HF (p) - Percentuale di spin di successo.

2. L'elenco delle lunghezze delle serie vincitrici è (K _ 1, K _ 2 ,\dots) (e separatamente per «significativi»).

3. Quantili le lunghezze delle serie: mediana, 75, 90.

4. Serie massima (Max W-streak) del segmento (N).

5. Numero di serie di ≥ (k) per più soglie (ad esempio, ≥3, ≥5).

6. Le statistiche delle serie perse (L-streak) sono simmetriche, è importante per le losse di stop sul dorso.

3) Interpretazione rapida dei numeri

Se le frequenze osservate (# {K\ge k }/#\text {serie}) sono vicine a (p ^ {k-1}), il comportamento sembra indipendente.

Le deviazioni su brevi campioni sono normali. Vedere gli intervalli di incertezza (bootstrap nell'elenco (K _ i) e/o nella simulazione.

Max W-streak cresce logaritmicamente per (N): le serie «belle» sono lunghe anche quando sono piccole (p).

Un mini esempio. Lascia HF (p = 0 {,} 30). Allora:

(\mathbb{P}(K\ge3)=p^2=0{,}09); (N = 1000) spin in attesa (\approx N (1-p) p ^ {2 }\approx 630\times0 {,} 09\approx 57) serie ≥3. Per i : (p ^ {5 }\approx 0 {,} 00243) (630\times0 {,} 00243\approx 1 {,} 5) serie è raro, ma non miracoloso.

4) Le ipotesi «non sono esagerate?»

Utilizzare uno o più strumenti:

1. Confronto con la geometria.

Valuta (p =\widehat {HF}).

Costruisci teorici (\mathbb {P} (K\ge k) = p ^ {k-1}) e confrontati con l'empirica.

Aggiungi le barre di fiducia (butstrap) per le quote osservate.

2. Test Valda-Wolfowitz.

Classificare le spalle come successo/inattività.

Confrontare il numero di «serie» con quello previsto per l'indipendenza.

Deviazioni sostanziali possono indicare dipendenza (o solo una piccola selezione).

3. Montecarlo è sotto zero.

Con (p) fisso, simulate migliaia di sequenze di lunghezza (N).

Vedere la distribuzione di Max W-streak e il numero di serie ≥ (k).

Confrontare le osservazioni con questa distribuzione (p-valore «troppo insolito o no»).

💡 Se si seleziona «successo» una cosa rara (ad esempio, ≥×10), usi solo le spalle binarie su questa soglia: 1/0.

5) Pratica: come elaborare i calcoli (senza codice)

1. Raccogli il numero di schiena, il risultato (animatore), le bandiere binarie «successo», «successo significativo».

2. Fare un salto sulla colonna di successo e formare le lunghezze delle serie (conteggio, scollatura a 0).

3. Calcolare:

(p =) media per bandiera di successo;
Quantili (K)
– Max W-streak;
frequenze (# {K\ge k}) per (k = 2.. 7).
4. Creare una teoria: (p ^ {k-1}) e il numero di serie previsto (k): (N (1-p) p ^ {k-1}).
5. Simulazione zero (almeno 10k test) - Distribuisce Max W-streak e il numero di serie ≥ (k).
6. Paragonate la conclusione: «Al di sopra delle aspettative »/« al di sopra delle aspettative, ma si colloca nelle fasce di fiducia »/« sospetto - manca di dati».

6) Trappole tipiche

Selezione selettiva della finestra. Abbiamo preso un periodo fortunato. Le serie sembrano una magia. Utilizzare la lunghezza fissa della finestra (ad esempio batch da 1000 spin).

Cambiare i criteri di successo al volo. Prima decidi cos'è il successo e non cambi il risultato.

Una confusione tra «serie vincitrice» e «serie di spin pro». Queste sono binarie diverse (HF vs «rate di pagamento»).

Interpretazione come predizione. Le serie descrivono l'ultimo pattern senza riferire la schiena successiva (indipendenza).

7) Come utilizzare le serie nella gestione dei rischi

Limiti alle spalle. Conoscendo i quantili di serie perse (L-streak), impostate il timeout dopo il L≥k.

Il piano della banca. Se la serie mediana vincente è breve e la serie «significativa» è rara, contate su «deserti».

Lunghezza della sessione. La probabilità di incontrare una serie di ≥ (k) cresce con (N). Se il tuo obiettivo è «catturare il ≥×10», valuti (q =\mathbb {P} (\ text{≥×10 per lo spin}) e usa (\mathbb {P} (\text {non catturare per} N) = (1-q) ^ N).

Disattivare il raggiungimento. Le serie non offrono vantaggi per l'aumento del tasso - è solo una forma di dispersione.

8) Mini-modello per i tuoi articoli/rapporti

Criteri di successo: (qualsiasi vincita/ ≥×10/spin pro)

HF (valutazione (p)): ...%

Quantili lunghezza serie W: mediana...; 75... 90...

Numero di serie ≥3/ ≥5/ ≥6: dato .../.../...; in attesa (N (1-p) p ^ {k-1}) .../.../...

Max W-streak: fatto...; intervallo di simulazione (Q5-Q95):... -...

Output: corrispondenza modello/richiesta di più dati raccomandazioni sui limiti.

9) Piccoli punti di riferimento (per calibrare l'intuizione)

Per HF (p = 0 {,} 25): serie W mediana 1-2, (\mathbb {P} (K\ge5) = p ^ {4 }\approx 0 {,} 39%). In (N = 2000), gli spin sono in attesa delle serie ≥5 (\approx 1500\times0 {,} 0039\approx 6).

In caso di evento raro (q = 1%) (ad esempio, ≥×10): lunghezza mediana «serie di significati» = 1 (raramente 2 + consecutivi) e distanze tra le spalle l'analisi delle serie è più utile in termini di pausa tra eventi che in termini consecutivi.

10) Breve assegno-foglio di analisi

Ho ben stabilito i criteri di successo?

La lunghezza della finestra e la quantità di dati sono sufficienti (batch, più di un test)?

Confrontato con la geometria e Montecarlo sotto la stessa (p)?

Ha mostrato Quantili e Max W-streak con barre di fiducia?

Le conclusioni riguardano la gestione dei rischi, non il timing?

Le serie vincenti sono la forma normale di una manifestazione accidentale. La loro analisi consiste nel lavorare sulla distribuzione geometrica e confrontare le osservazioni con il modello zero (e/o la simulazione) anziché cercare l'orologio caldo. I numeri grigi - HF, quantili lunghezze, il numero previsto di serie e la distribuzione della massima serie - si armano per pianificare la banca, la durata della sessione e i limiti, rimanendo all'interno della matematica onesta, non superstizioni.