Როგორ გავაანალიზოთ გამარჯვებული სერიები
„გამარჯვებული სერია“ არის ზედიზედ წარმატებული შედეგები (ჰიტები) ორ შეუსაბამობას შორის. სერიის გულწრფელ თამაშში (დამოუკიდებელი უკანა), ისინი ბუნებრივია: შემთხვევითი შემთხვევა იწვევს მტევანს. სერიის კომპეტენტური ანალიზი ხელს უწყობს რისკის პროფილის გაგებას (რამდენად ხშირად „მიდის“) და ლიმიტების კონფიგურაციას. ის არ იწინასწარმეტყველებს შემდეგ ზურგს.
1) ძირითადი მოდელი: ბერნული და სერიების გეომეტრია
მოდით, თითოეული სპინი დამოუკიდებელი გამოცდაა წარმატების ალბათობით (პ) (მაგალითად, „ნებისმიერი მოგება“ ან „მნიშვნელოვანი გამარჯვება“).
გამარჯვებული სერიის სიგრძე (K\ge1) პირველ დანაკარგამდე განაწილებულია გეომეტრიულად:[
\mathbb{P}(K=k)=(1-p),p^{k-1},\quad \mathbb{E}[K]=\frac{1}{1-p},\quad \mathrm{Med}(K)\approx \left\lceil \frac{\ln 0. 5}{\ln p}\right\rceil.
]სერიის ალბათობა, რომლის სიგრძეა - (k): (\mathbb {P} (K\ge k) = p = {, k-1}).
სერიების (ყველა სიგრძის) მოსალოდნელი რაოდენობა (N) სპინების (N (1-p)).
სერიების მოსალოდნელი რაოდენობა, რომელთა სიგრძეა - (k) სიგრძით (N) spins - (N (1-p), p = {, k-1}).
2) კონკრეტულად რა უნდა გაზომოთ თქვენს ლოგიკებზე
ჯერ განსაზღვრეთ, რა არის წარმატება:- „ნებისმიერი მოგება“ (HF), ან
- „მნიშვნელოვანი“ (ბარიერი, მაგალითად, 3 × 5/× 10), ან
- „დადებითი სპინი“ (გადახდა - განაკვეთი).
1. HF (შეფასება (p)): წარმატებული სპინების წილი.
2. გამარჯვების სერიის სიგრძეების სია: (K _ 1, K _ 2 ,\dots) (და ცალკე „მნიშვნელოვანი“).
3. კვანილი სერიების სიგრძეა: საშუალო, 75-ე, 90-ე.
4. მაქსიმალური სერია (Max W-streak) სეგმენტზე (N).
5. სერიების რაოდენობა არის (k) რამდენიმე რეიდისთვის (k) (მაგალითად, 3, 5 ევრო).
6. დაკარგული სერიების სტატისტიკა (L-streak) სიმეტრიულია, ეს მნიშვნელოვანია ზურგზე გაჩერებული ლოსებისთვის.
3) ციფრების სწრაფი ინტერპრეტაცია
თუ დაკვირვებული სიხშირეები (# {K\ge k }/#\ტექსტი {სერია}) ახლოსაა (p = {k-1}), ქცევა ჰგავს დამოუკიდებელს.
მოკლე ნიმუშებზე გადახრები ნორმაა. იხილეთ გაურკვევლობის ინტერვალები (bootstrap ჩამონათვალის მიხედვით (K _ i)) და/ან სიმულაცია.
Max W-streak იზრდება ლოგარითმულად (N): გრძელი „ლამაზი“ სერიები მცირეა (p).
მინი მაგალითი. მოდით HF (p = 0 {,} 30). შემდეგ:- (\mathbb{P}(K\ge3)=p^2=0{,}09); (N = 1000) სპინებზე ველოდებით (\approx N (1-p) p> {2 }\\approx 630\times0 {,} 09/approx 57) სერიებს -3. 6: (p = 5 {\\approx 0 {, 00243), ეპიზოდი (630\times0 {,} 00243\approx 1 {, 5}) იშვიათი, მაგრამ არა სასწაული.
4) ჰიპოთეზის შემოწმება: „არ არის სერია გადაჭარბებული?“
გამოიყენეთ ერთი ან მეტი ინსტრუმენტი:1. შედარება გეომეტრიასთან.
შეაფასეთ (p =\widehat {HF}).
ააშენეთ თეორიული (\mathbb {P} (K\ge k) = p {k-1}) და შეადარეთ ემპირიკას.
დაამატეთ სანდო ზოლები (bootstrap) დაკვირვებული აქციებისთვის.
2. ვალდ-ვოლფოვიცის ტესტი.
უკანა კლასიფიკაცია, როგორც წარმატება/წარუმატებლობა.
შეადარეთ „სერიების“ რაოდენობა დამოუკიდებლობისთვის მოსალოდნელ რაოდენობას.
მნიშვნელოვანი გადახრები შეიძლება მიუთითებდეს დამოკიდებულებაზე (ან უბრალოდ მცირე ნიმუშზე).
3. მონტე კარლო ნულის ქვეშ.
ფიქსირებული (p) სიგრძის ათასობით თანმიმდევრობა (N).
შეხედეთ Max W-streak- ის განაწილებას და სერიების რაოდენობას (კ).
შეადარეთ თქვენი დაკვირვებები ამ განაწილებასთან (p- მნიშვნელობა „ძალიან უჩვეულოა თუ არა“).
5) პრაქტიკა: როგორ გამოვთვალოთ გამოთვლები (კოდის გარეშე)
1. შეაგროვეთ ჟურნალი: უკანა მხარე, შედეგი (მულტიპლიკატორი), ორობითი დროშები „წარმატება“, „მნიშვნელოვანი წარმატება“.
2. გაიღვიძეთ წარმატების სვეტის მიხედვით და ჩამოაყალიბეთ სერიების სიგრძე (მრიცხველი, რომელიც 0-ზე გადააგდეს უხერხულობის დროს).
3. გამოთვალეთ:- (p =) საშუალო წარმატების დროშა;
- კვანილი (K);
- – Max W-streak;
- სიხშირე (# {K\ge k}) (k = 2.. 7).
- 4. ააშენეთ თეორია: (p = {k-1}) და სერიების მოსალოდნელი რაოდენობა (k): (N (1-p) p {k-1}).
- 5. გააკეთეთ ნულოვანი სიმულაცია (მინიმუმ 10k პროგონები) - Max W-streak განაწილება და სერიების რაოდენობა (k).
- 6. შეადარეთ დასკვნა: „მოლოდინების ფარგლებში “/„ მოლოდინების ზემოთ, მაგრამ ჯდება ნდობის ხაზებში “/„ საეჭვოა - არ არის საკმარისი მონაცემები“.
6) ტიპიური ხაფანგები
შერჩევითი ფანჯრის არჩევანი. მათ აიღეს „წარმატებული“ პერიოდი - სერია ჯადოსნურად გამოიყურება. გამოიყენეთ ფიქსირებული ფანჯრის სიგრძე (მაგალითად, 1000 სპინის ბატები).
წარმატების კრიტერიუმების შეცვლა ფრენაზე. პირველი, გადაწყვიტეთ რა არის „წარმატება“ და არ შეცვალოთ შედეგი.
„გამარჯვების სერიის“ დაბნეულობა და „დადებითი სპინების სერია“. ეს არის სხვადასხვა ბინარიზაცია (HF vs „გადახდა - განაკვეთი“).
ინტერპრეტაცია, როგორც პროგნოზი. სერია აღწერს წარსულ ნიმუშს, არაფერს ამბობს შემდეგი ზურგზე (დამოუკიდებლობა).
7) როგორ გამოვიყენოთ სერიები რისკის მართვის დროს
ზურგის ლიმიტები. იცის წაგებული სერიების მეოთხედი (L-streak), ჰკითხეთ „დრო L-k შემდეგ“.
ბანკის გეგმა. თუ საშუალო გამარჯვებული სერია ხანმოკლეა და „მნიშვნელოვანი“ იშვიათია, გამოითვალეთ ბანკი „უდაბნოებისთვის“.
სესიის სიგრძე. სერიის (კ) შეხვედრის ალბათობა იზრდება (N). თუ თქვენი მიზანი არის „დაჭერა × 10“, შეაფასეთ (q =\\mathbb {P} (\text {2 × 10 spin})) და გამოიყენეთ (\mathbb {P} (\text {არ დაიჭიროთ} N) = (1-q) ^ N).
დოგონის გამორთვა. სერია არ იძლევა უპირატესობას განაკვეთის გაზრდისთვის - ეს მხოლოდ დისპერსიის ფორმაა.
8) მინი შაბლონი თქვენი სტატიებისთვის/მოხსენებებისთვის
წარმატების კრიტერიუმი: (ნებისმიერი მოგება/2 × 10/პლუს უკანა)
HF (ნიშანი (p)): ...%
W- სერიების სიგრძე: საშუალო...; 75-ე...; 90-ე...
სერიების რაოდენობა - 3/5/6 6: ფაქტი .../.../...; მოლოდინი (N (1-p) p {k-1}) .../.../...
Max W-streak: ფაქტი...; სიმულაციის დიაპაზონი (Q5-Q95):... -...
დასკვნა: მოდელის შესაბამისობა/საჭიროა მეტი მონაცემი; რეკომენდაციები ლიმიტების შესახებ.
9) მცირე სახელმძღვანელოები (ინტუიციის შესაქმნელად)
HF (p = 0 {,} 25): საშუალო W სერია - 1-2, (\mathbb {P} (K\ge5) = p {4 }\approx 0 {, 39%). (N = 2000) ზურგზე, სერიების მოლოდინი არის 5: (\approx 1500\times0 {,} 0039\approx 6).
იშვიათი მოვლენის დროს (q = 1%) (მაგალითად, 10 × 10): „მნიშვნელოვანი სერიის“ = 1 საშუალო სიგრძე (იშვიათად ხდება 2 + ზედიზედ), და ასეთ ზურგს შორის მანძილი დიდია; სერიების ანალიზი უფრო სასარგებლოა „მოვლენებს შორის პაუზა“, ვიდრე „ზედიზედ“.
10) მოკლე ანალიტიკური სია
ნათლად დავწერე წარმატების კრიტერიუმი?
ფანჯრის სიგრძე და მონაცემების მოცულობა საკმარისია (ბატჩები, ერთზე მეტი რქა)?
შეადარა გეომეტრიასა და მონტე კარლოს იგივე (პ) ქვეშ?
აჩვენა თუ არა Max W-streak სანდო ზოლებით?
დასკვნები ეხება რისკის მართვას და არა განაკვეთის „დროულად“?
შედეგი: გამარჯვებული სერია შემთხვევითი მანიფესტაციის ნორმალური ფორმაა. მათი ანალიზი არის გეომეტრიული განაწილების მუშაობა და დაკვირვებების შედარება ნულოვან მოდელთან (ან/და სიმულაციასთან), და არა „ცხელი საათის“ ძებნა. ნაცრისფერი ციფრებით - HF, გადაყარეთ სერიების სიგრძე, მოსალოდნელი რაოდენობა და მაქსიმალური სერიის განაწილება - თქვენ შეიარაღებული ხართ ბანკის დაგეგმვისთვის, სესიისა და ლიმიტის ხანგრძლივობისთვის, დარჩით გულწრფელი მათემატიკის ფარგლებში და არა ცრურწმენით.
