Как анализировать выигрышные серии
«Выигрышная серия» — это подряд идущие успешные исходы (хиты) между двумя неуспехами. В честной игре (независимые спины) серии естественны: случайность порождает кластеры. Грамотный анализ серий помогает понять профиль риска (как часто «идёт») и настроить лимиты. Он не предсказывает следующий спин.
1) Базовая модель: Бернулли и геометрия серий
Пусть каждый спин — независимое испытание с вероятностью успеха (p) (например, «любой выигрыш» или «значимый выигрыш ≥×10»).
Длина выигрышной серии (K\ge1) до первого проигрыша распределена геометрически:[
\mathbb{P}(K=k)=(1-p),p^{k-1},\quad \mathbb{E}[K]=\frac{1}{1-p},\quad \mathrm{Med}(K)\approx \left\lceil \frac{\ln 0.5}{\ln p}\right\rceil.
]Вероятность серии длиной ≥ (k): (\mathbb{P}(K\ge k)=p^{,k-1}).
Ожидаемое число серий (всех длин) на (N) спинов ≈ (N(1-p)).
Ожидаемое число серий длиной ≥ (k) на (N) спинов ≈ (N(1-p),p^{,k-1}).
2) Что именно измерять на ваших логах
Сначала определите, что считать успехом:- – «любой выигрыш» (HF), или
- – «значимый» (порог, например, ≥×5/×10), или
- – «плюсовый спин» (выплата ≥ ставка).
1. HF (оценка (p)): доля успешных спинов.
2. Список длин серий выигрышей: (K_1,K_2,\dots) (и отдельно — для «значимых»).
3. Квантили длин серий: медиана, 75-й, 90-й перцентили.
4. Максимальная серия (Max W-streak) на отрезке (N).
5. Число серий ≥ (k) для нескольких порогов (k) (например, ≥3, ≥5).
6. Статистика проигрышных серий (L-streak) — симметрично, это важно для стоп-лоссов по спинам.
3) Быстрая интерпретация цифр
Если наблюдаемые частоты (#{K\ge k}/#\text{серий}) близки к (p^{k-1}), поведение похоже на независимое.
Отклонения на коротких выборках — норма. Смотрите интервалы неопределённости (бутстрэп по списку (K_i)) и/или симуляции.
Max W-streak растёт логарифмически по (N): длинные «красивые» серии бывают даже при небольшом (p).
Мини-пример. Пусть HF (p=0{,}30). Тогда:- (\mathbb{P}(K\ge3)=p^2=0{,}09); на (N=1000) спинов ожидаем (\approx N(1-p)p^{2}\approx 630\times0{,}09\approx 57) серий ≥3. Для ≥6: (p^{5}\approx 0{,}00243) ⇒ ≈ (630\times0{,}00243\approx 1{,}5) серий — редкость, но не чудо.
4) Проверки гипотез: «не завышены ли серии?»
Используйте один или несколько инструментов:1. Сравнение с геометрией.
– Оцените (p=\widehat{HF}).
– Постройте теоретические (\mathbb{P}(K\ge k)=p^{k-1}) и сравните с эмпирикой.
– Добавьте доверительные полосы (бутстрэп) для наблюдаемых долей.
2. Тест Вальда–Вольфовица (runs test).
– Классифицируйте спины как успех/неуспех.
– Сравните число «серий» (runs) с ожидаемым при независимости.
– Существенные отклонения могут указывать на зависимость (или просто маленькую выборку).
3. Монте-Карло под нулём.
– При фиксированном (p) сымитируйте тысячи последовательностей длины (N).
– Посмотрите распределение Max W-streak и числа серий ≥ (k).
– Сравните ваши наблюдения с этим распределением (p-значение «слишком необычно или нет»).
5) Практика: как оформить расчёты (без кода)
1. Соберите лог: № спина, результат (мультипликатор), бинарные флаги «успех», «значимый успех».
2. Пробегитесь по колонке успехов и сформируйте длины серий (счётчик, сброс на 0 при неуспехе).
3. Рассчитайте:- – (p=) средняя по флагу успеха;
- – квантили (K);
- – Max W-streak;
- – частоты (#{K\ge k}) для (k=2..7).
- 4. Постройте теорию: (p^{k-1}) и ожидаемое число серий ≥(k): (N(1-p)p^{k-1}).
- 5. Сделайте симуляцию нуля (хотя бы 10k прогонов) — распределение Max W-streak и числа серий ≥(k).
- 6. Сравните и вывод: «В пределах ожиданий» / «выше ожиданий, но укладывается в доверительные полосы» / «подозрительно — не хватает данных».
6) Типичные ловушки
Селективный выбор окна. Взяли «удачный» период — серии кажутся магией. Используйте фиксированную длину окна (например, батчи по 1000 спинов).
Смена критериев успеха на лету. Сначала решите, что такое «успех», и не меняйте по результату.
Путаница «серии выигрышей» и «серии плюсовых спинов». Это разные бинаризации (HF vs «выплата ≥ ставка»).
Интерпретация как предсказание. Серии описывают прошлый узор, не сообщая ничего о следующем спине (независимость).
7) Как использовать серии в управлении риском
Лимиты по спинам. Зная квантили проигрышных серий (L-streak), задайте «тайм-аут после L≥k».
План банка. Если медианная выигрышная серия короткая, а «значимая» редка, рассчитывайте банк на «пустыни».
Длина сессии. Вероятность встретить серию ≥(k) растёт с (N). Если ваша цель «поймать ≥×10», оцените (q=\mathbb{P}(\text{≥×10 за спин})) и используйте (\mathbb{P}(\text{не поймать за }N)=(1-q)^N).
Отключить догон. Серии не дают преимущества для увеличения ставки — это просто форма дисперсии.
8) Мини-шаблон для ваших статей/отчётов
Критерий успеха: (любой выигрыш / ≥×10 / плюсовой спин)
HF (оценка (p)): …%
Квантили длины W-серий: медиана …; 75-й …; 90-й …
Число серий ≥3 / ≥5 / ≥6: факт … / … / …; ожидание (N(1-p)p^{k-1}) … / … / …
Max W-streak: факт …; диапазон по симуляции (Q5–Q95): …–…
Вывод: соответствие модели / требуется больше данных; рекомендации по лимитам.
9) Небольшие ориентиры (чтобы калибровать интуицию)
При HF (p=0{,}25): медианная W-серия ≈ 1–2, (\mathbb{P}(K\ge5)=p^{4}\approx 0{,}39%). На (N=2000) спинов ожидание серий ≥5: (\approx 1500\times0{,}0039\approx 6).
При редком событии (q=1%) (например, ≥×10): медианная длина «серии значимых» = 1 (редко бывает 2+ подряд), а расстояния между такими спинами большие; анализ серий полезнее в терминах «паузы между событиями», чем «подряд».
10) Короткий чек-лист аналитика
Я чётко зафиксировал критерий успеха?
Длина окна и объём данных достаточны (батчи, не один прогон)?
Сравнил с геометрией и Монте-Карло под тем же (p)?
Показал квантили и Max W-streak с доверительными полосами?
Выводы касаются управления риском, а не «тайминга» ставки?
Итог: выигрышные серии — нормальная форма проявления случайности. Их анализ — это работа с геометрическим распределением и сравнение наблюдений с нулевой моделью (и/или симуляцией), а не поиск «горячих часов». Серыми цифрами — HF, квантили длин, ожидаемое число серий и распределение максимальной серии — вы вооружаетесь для планирования банка, длительности сессии и лимитов, оставаясь в рамках честной математики, а не суеверий.
