Як аналізувати виграшні серії
«Виграшна серія» - це поспіль йдуть успішні результати (хіти) між двома неуспіхами. У чесній грі (незалежні спини) серії природні: випадковість породжує кластери. Грамотний аналіз серій допомагає зрозуміти профіль ризику (як часто «йде») і налаштувати ліміти. Він не пророкує наступний спін.
1) Базова модель: Бернуллі і геометрія серій
Нехай кожен спін - незалежне випробування з імовірністю успіху (p) (наприклад, «будь-який виграш» або «значущий виграш ≥×10»).
Довжина виграшної серії (K\ge1) до першого програшу розподілена геометрично:[
\mathbb{P}(K=k)=(1-p),p^{k-1},\quad \mathbb{E}[K]=\frac{1}{1-p},\quad \mathrm{Med}(K)\approx \left\lceil \frac{\ln 0. 5}{\ln p}\right\rceil.
]Ймовірність серії довжиною ≥ (k): (\mathbb{P}(K\ge k)=p^{,k-1}).
Очікуване число серій (всіх довжин) на (N) спінів ≈ (N (1-p)).
Очікуване число серій довжиною ≥ (k) на (N) спінів ≈ (N (1-p), p ^ {, k-1}).
2) Що саме вимірювати на ваших логах
Спочатку визначте, що вважати успіхом:- «будь-який виграш» (HF), або
- «значущий» (поріг, наприклад, ≥×5/×10), або
- «плюсовий спін» (виплата ≥ ставка).
1. HF (оцінка (p)): частка успішних спінів.
2. Список довжин серій виграшів: (K_1,K_2,\dots) (і окремо - для «значущих»).
3. Квантилі довжин серій: медіана, 75-й, 90-й перцентили.
4. Максимальна серія (Max W-streak) на відрізку (N).
5. Число серій ≥ (k) для декількох порогів (k) (наприклад, ≥3, ≥5).
6. Статистика програшних серій (L-streak) - симетрично, це важливо для стоп-лоссів по спинах.
3) Швидка інтерпретація цифр
Якщо спостережувані частоти (# {K\ge k }/#\text {серій}) близькі до (p ^ {k-1}), поведінка схожа на незалежну.
Відхилення на коротких вибірках - норма. Дивіться інтервали невизначеності (бутстреп за списком (K_i)) і/або симуляції.
Max W-streak росте логарифмічно по (N): довгі «красиві» серії бувають навіть при невеликому (p).
Міні-приклад. Нехай HF (p = 0 {,} 30). Тоді:- (\mathbb{P}(K\ge3)=p^2=0{,}09); на (N = 1000) спінів очікуємо (\approx N (1-p) p ^ {2 }\approx 630\times0 {,} 09\approx 57) серій ≥3. Для ≥6: (p ^ {5 }\approx 0 {,} 00243) ⇒ ≈ (630\times0 {,} 00243\approx 1 {,} 5) серій - рідкість, але не диво.
4) Перевірки гіпотез: «Чи не завищені серії?»
Використовуйте один або декілька інструментів:1. Порівняння з геометрією.
Оцініть (p =\widehat {HF}).
Побудуйте теоретичні (\mathbb {P} (K\ge k) = p ^ {k-1}) і порівняйте з емпірикою.
Додайте довірчі смуги (бутстреп) для спостережуваних часток.
2. Тест Вальда-Вольфовіца (runs test).
Класифікуйте спини як успіх/неуспіх.
Порівняйте число «серій» (runs) з очікуваним при незалежності.
Істотні відхилення можуть вказувати на залежність (або просто маленьку вибірку).
3. Монте-Карло під нулем.
При фіксованому (p) зімітуйте тисячі послідовностей довжини (N).
Подивіться розподіл Max W-streak і числа серій ≥ (k).
Порівняйте ваші спостереження з цим розподілом (p-значення «занадто незвично чи ні»).
5) Практика: як оформити розрахунки (без коду)
1. Зберіть лог: № спина, результат (мультиплікатор), бінарні прапори «успіх», «значущий успіх».
2. Пробіжіться по колонці успіхів і сформуйте довжини серій (лічильник, скидання на 0 при неуспіху).
3. Розрахуйте:- (p =) середня по прапору успіху;
- квантилі (K);
- – Max W-streak;
- частоти (# {K\ge k}) для (k = 2.. 7).
- 4. Побудуйте теорію: (p ^ {k-1}) і очікуване число серій ≥ (k): (N(1-p)p^{k-1}).
- 5. Зробіть симуляцію нуля (хоча б 10k прогонів) - розподіл Max W-streak і числа серій ≥ (k).
- 6. Порівняйте і висновок: «В межах очікувань »/« вище очікувань, але вкладається в довірчі смуги »/« підозріло - не вистачає даних».
6) Типові пастки
Селективний вибір вікна. Взяли «вдалий» період - серії здаються магією. Використовуйте фіксовану довжину вікна (наприклад, батчі по 1000 спінів).
Зміна критеріїв успіху на льоту. Спочатку вирішіть, що таке «успіх», і не змінюйте за результатом.
Плутанина «серії виграшів» і «серії плюсових спінів». Це різні бінаризації (HF vs «виплата ≥ ставка»).
Інтерпретація як передбачення. Серії описують минулий візерунок, не повідомляючи нічого про наступний спині (незалежність).
7) Як використовувати серії в управлінні ризиком
Ліміти по спинах. Знаючи квантилі програшних серій (L-streak), задайте «тайм-аут після L≥k».
План банку. Якщо медіанна виграшна серія коротка, а «значуща» рідкісна, розраховуйте банк на «пустелі».
Довжина сесії. Ймовірність зустріти серію ≥ (k) зростає з (N). Якщо ваша мета «зловити ≥×10», оцініть (q =\mathbb {P} (\ text{≥×10 за спин})) і використовуйте (\mathbb {P} (\text {не зловити за} N) = (1-q) ^ N).
Відключити догон. Серії не дають переваги для збільшення ставки - це просто форма дисперсії.
8) Міні-шаблон для ваших статей/звітів
Критерій успіху: (будь-який виграш/ ≥×10/плюсовий спин)
HF (оцінка (p)): …%
Квантилі довжини W-серій: медіана...; 75-й...; 90-й...
Кількість серій ≥3/ ≥5/ ≥6: факт .../.../...; очікування (N (1-p) p ^ {k-1}) .../.../...
Max W-streak: факт...; діапазон по симуляції (Q5-Q95): …–…
Висновок: відповідність моделі/потрібно більше даних; рекомендації щодо лімітів.
9) Невеликі орієнтири (щоб калібрувати інтуїцію)
При HF (p = 0 {,} 25): медіанна W-серія ≈ 1-2, (\mathbb {P} (K\ge5) = p ^ {4 }\approx 0 {,} 39%). На (N = 2000) спінів очікування серій ≥5: (\approx 1500\times0{,}0039\approx 6).
При рідкісній події (q = 1%) (наприклад, ≥×10): медіанна довжина «серії значущих» = 1 (рідко буває 2 + підряд), а відстані між такими спинами великі; аналіз серій корисніше в термінах «паузи між подіями», ніж «підряд».
10) Короткий чек-лист аналітика
Я чітко зафіксував критерій успіху?
Довжина вікна і обсяг даних достатні (батчі, не один прогін)?
Порівняв з геометрією і Монте-Карло під тим же (p)?
Показав квантилі і Max W-streak з довірчими смугами?
Висновки стосуються управління ризиком, а не «таймінгу» ставки?
Підсумок: виграшні серії - нормальна форма прояву випадковості. Їх аналіз - це робота з геометричним розподілом і порівняння спостережень з нульовою моделлю (і/або симуляцією), а не пошук «гарячих годин». Сірими цифрами - HF, квантилі довжин, очікуване число серій і розподіл максимальної серії - ви озброюєтеся для планування банку, тривалості сесії і лімітів, залишаючись в рамках чесної математики, а не забобонів.
