Ұтыс серияларын қалай талдауға болады
«Ұтыс сериясы» - бұл қатарынан екі сәтсіздік арасындағы табысты нәтижелер (хиттер). Әділ ойында (тәуелсіз арқалар) сериялар табиғи: кездейсоқтық кластерлерді тудырады. Серияларды сауатты талдау тәуекел профилін түсінуге (қаншалықты жиі «келеді») және лимиттерді орнатуға көмектеседі. Ол келесі арқаны болжамайды.
1) Базалық модель: Бернулли және серия геометриясы
Әрбір спин - (p) сәттілік ықтималдығымен тәуелсіз сынақ болсын (мысалы, «кез келген ұтыс» немесе «маңызды ұтыс ≥ × 10»).
Ұтыс сериясының ұзындығы (K\ge1) бірінші ұтысқа дейін геометриялық түрде бөлінген:[
\mathbb{P}(K=k)=(1-p),p^{k-1},\quad \mathbb{E}[K]=\frac{1}{1-p},\quad \mathrm{Med}(K)\approx \left\lceil \frac{\ln 0. 5}{\ln p}\right\rceil.
]Ұзындығы ≥ (k) сериясының ықтималдығы: (\mathbb {P} (K\ge k) = p ^ {, k-1}).
Сериялардың күтілетін саны (барлық ұзындықтар) (N) ≈ (N (1-p)).
Ұзындығы ≥ (k) серияларының күтілетін саны (N) ≈ (N (1-p), p ^ {, k-1}).
2) Сіздің логыңызда нені өлшеу керек
Алдымен не табысқа жететінін анықтаңыз:- «кез келген ұтыс» (HF), немесе
- «маңызды» (мысалы, ≥ × 5/ × 10), немесе
- «артықшылығы бар спин» (төлем ≥ мөлшерлеме).
1. HF (бағалау (p)): табысты спиндердің үлесі.
2. Ұтыстар сериясы ұзындықтарының тізімі: (K_1,K_2,\dots) (және жеке - «маңызды» үшін).
3. Сериялар ұзындығының квантилдері: медиана, 75-ші, 90-шы перцентилдер.
4. Кесіндідегі ең үлкен серия (Max W-streak) (N).
5. Бірнеше табалдырықтар үшін ≥ (k) серияларының саны (k) (мысалы, ≥ 3, ≥ 5).
6. Жоғалған сериялардың статистикасы (L-streak) - симметриялы, бұл арқасы бойынша стоп-лосстар үшін маңызды.
3) Сандарды жылдам түсіндіру
Егер бақыланатын жиіліктер (# {K\ge k }/#\text {сериялар}) (p ^ {k-1}) жақын болса, мінез-құлық тәуелсіз.
Қысқа іріктемелердегі ауытқулар - норма. Белгісіздік аралығын қараңыз (тізім бойынша бутстрэп (K_i)) және/немесе симуляция.
Max W-streak логарифмдік түрде (N) өседі: ұзын «әдемі» сериялар аз болса да болады (p).
Шағын мысал. HF (p = 0 {,} 30) болсын. Сонда:- (\mathbb{P}(K\ge3)=p^2=0{,}09); (N = 1000) спиндерді күтеміз (\approx N (1-p) p ^ {2 }\approx 630\times0 {,} 09\approx 57) сериялар ≥ 3. 6- ≥ үшін: (p ^ {5 }\approx 0 {,} 00243) ⇒ ≈ (630\times0 {,} 00243\approx 1 {,} 5) сериялар - сирек, бірақ керемет емес.
4) Гипотезаларды тексеру: «сериясы жоғары емес пе?»
Бір немесе бірнеше құралды пайдаланыңыз:1. Геометриямен салыстыру.
Бағалаңыз (p =\widehat {HF}).
Теориялық (\mathbb {P} (K\ge k) = p ^ {k-1}) құрыңыз және эмпирикамен салыстырыңыз.
Бақыланатын үлестер үшін сенімді жолақтарды (бутстрэп) қосыңыз.
2. Вальда-Вольфовиц тесті (runs test).
Арқаңызды табыс/сәтсіздік деп жіктеңіз.
Тәуелсіздік кезінде күтілетін «сериялар» (runs) санын салыстырыңыз.
Елеулі ауытқулар тәуелділікті (немесе жай ғана шағын іріктемені) көрсетуі мүмкін.
3. Монте-Карло нөлге жетті.
(p) тіркелген кезде ұзындықтың (N) мыңдаған тізбектерін имитациялаңыз.
Max W-streak таратылуын және ≥ (k) серияларының санын қараңыз.
Бақылауларыңызды осы үлестіріммен салыстырып көріңіз (p-мәні «тым ерекше немесе жоқ»).
5) Практика: есептеулерді қалай рәсімдеу керек (кодсыз)
1. Журналды жинаңыз: арқа №, нәтиже (мультипликатор), «табыс», «маңызды табыс» бинарлық жалаулары.
2. Сәттілік бағаны бойынша жүгіріңіз және серия ұзындығын қалыптастырыңыз (санақ, сәтсіздік кезінде 0-ге түсіру).
3. Есептеңіз:- (p =) табыс туы бойынша орташа;
- квантили (K);
- – Max W-streak;
- жиілік (# {K\ge k}) үшін (k = 2.. 7).
- 4. Теория жасаңыз: (p ^ {k-1}) және күтілетін серия саны ≥ (k): (N (1-p) p ^ {k-1}).
- 5. Нөлге симуляция жасаңыз (кем дегенде 10k прогондар) - Max W-streak және ≥ (k) серияларының сандарын бөлу.
- 6. Салыстырыңыз және қорытынды: «Күту шегінде »/« күткеннен жоғары, бірақ сенімді жолақтарға салынады »/« күмәнді - деректер жетіспейді».
6) Типтік тұзақтар
Терезені таңдау. «Сәтті» кезеңді алдық - сериялар сиқырға ұқсайды. Терезенің белгіленген ұзындығын пайдаланыңыз (мысалы, 1000 айналмалы батчи).
Ұшу кезіндегі табыс критерийлерін өзгерту. Алдымен «табыстың» не екенін шешіңіз және нәтижесіне қарай өзгертпеңіз.
«Ұтыстар сериясы» және «артықшылығы бар спиндер сериясы» шатасуы. Бұл әртүрлі бинаризация (HF vs «төлем ≥ мөлшерлеме»).
Болжау ретінде түсіндіру. Сериялар келесі арқасы (тәуелсіздік) туралы ештеңе хабарламай, өткен үлгіні сипаттайды.
7) Серияларды тәуекелді басқаруда қалай пайдалану керек
Арқалар бойынша лимиттер. Жоғалған сериялардың квантилін (L-streak) біліп, "L ≥ k" кейін тайм-аут "қойыңыз.
Банктің жоспары. Егер медианалық ұтыс сериясы қысқа, ал «маңызды» сирек болса, банкті «шөлге» сеніңіз.
Сессия ұзындығы. ≥ (k) сериясын кездестіру ықтималдығы (N) өседі. Егер сіздің мақсатыңыз «≥ × 10 ұстау» болса, (q =\mathbb {P} (\text {≥ × 10 артқы} үшін) бағалап, (\mathbb {P} (\text {N} үшін ұстау мүмкін емес) = (1-q) ^ N) пайдаланыңыз.
Догонды өшіру. Сериялар мөлшерлемені арттыруға артықшылық бермейді - бұл жай ғана дисперсия нысаны.
8) Мақалаларыңызға/есептеріңізге арналған шағын үлгі
Табыс критерийі: (кез келген ұтыс/ ≥ × 10/артықшылығы бар спин)
HF (бағалау (p)): ...%
W-сериясының ұзындығының квантилдері: медиана...; 75-ші...; 90...
Сериялар саны ≥ 3/ ≥ 5/ ≥ 6: факт .../.../...; күту (N (1-p) p ^ {k-1}) .../.../...
Max W-streak: факт...; симуляция бойынша диапазон (Q5-Q95):... -...
Қорытынды: модельдің сәйкестігі/көбірек деректер талап етіледі; лимиттер бойынша ұсынымдар.
9) Шағын бағдарлар (интуицияны калибрлеу үшін)
HF (p = 0 {,} 25) кезінде: медианалық W-сериясы ≈ 1-2, (\mathbb {P} (K\ge5) = p ^ {4 }\approx 0 {,} 39%). (N = 2000) ≥ 5 серияларын күту: (\approx 1500\times0 {,} 0039\approx 6).
Сирек оқиға кезінде (q = 1%) (мысалы, ≥ × 10): «мәнділер сериясының» медиандық ұзындығы = 1 (сирек 2 + қатарынан), ал мұндай арқалар арасындағы арақашықтық үлкен; серияларды талдау «оқиғалар арасындағы үзілістер» терминдерінде «қатарынан» қарағанда пайдалы.
10) Талдаманың қысқа чек-парағы
Мен жетістіктің критерийін нақты белгіледім бе?
Терезенің ұзындығы мен деректер көлемі жеткілікті ме (батчи, бір рет емес)?
Геометриямен және Монте-Карломен (p) салыстырдыңыз ба?
Сенім жолақтары бар Max W-streak квантилін көрсеттіңіз бе?
Қорытындылар мөлшерлеменің «таймингіне» емес, тәуекелді басқаруға қатысты ма?
Нәтижесі: ұтыс сериялары - кездейсоқ көріністің қалыпты түрі. Оларды талдау - бұл геометриялық бөлумен жұмыс және «ыстық сағаттарды» іздеу емес, нөлдік модельмен (және/немесе симуляциямен) байқауларды салыстыру. Сұр цифрлармен - HF, ұзындық квантилдері, сериялардың күтілетін саны және максималды серияның бөлінуі - сіз шынайы математиканың шеңберінде емес, шүбәсіз қалып, банкті, сессия ұзақтығын және лимиттерді жоспарлау үшін қаруланасыз.
