نحوه استفاده از آمار و تاریخ بازی برای پیش بینی
متن حجمی مقاله
آمار یک زبان احتمالات است. او آینده را «حدس نمی زند»، اما به ارزیابی شانس بهتر از شهود کمک می کند. تاریخچه مسابقات بخش مهمی از داده ها است، اما تفسیر نادرست آن آسان است: نمونه های کوچک، «جادوی جلسات شخصی»، اثر تقویم و شکل تیم ها تصویر را تحریف می کنند. در زیر یک راهنمای عملی برای چگونگی جمع آوری، تمیز کردن و اعمال آمار به طوری که برای به دست آوردن ضرایب معقول و پیدا کردن ارزش است.
1) چه اطلاعاتی واقعا مفید است
معیارهای فرمان پایه
نتایج: برد/تساوی/باخت، اختلاف هدف/امتیاز.
«کیفیت لحظات»: xG/xGA در فوتبال، کیفیت شات/اهداف مورد انتظار برای/در برابر هاکی، امتیاز تهاجمی/دفاعی در بسکتبال.
تمپو/سبک: مالکیت، سرعت حملات، مراحل انتقالی، فشار، 3PA/pace (NBA).
مقررات استاندارد، کرنر، پنالتی (فوتبال): اغلب یک منبع دست کم گرفته شده از شانس گلزنی است.
عوامل فردی
فهرست: صدمات، تعلیق، چرخش، دقیقه محدود، بازگشت رهبران.
هم افزایی و نقش ها: چه کسی لحظات را ایجاد می کند، چه کسی تبدیل می کند، چه کسی محافظت می کند.
زمینه کاری
خانه/دور، پرواز، تراکم تقویم (پشت به پشت در NBA، 3 بازی در 7 روز در فوتبال).
آب و هوا/سطح/ارتفاع (باد و باران سرعت و دقت را کاهش می دهد).
داوران/داوران (سبک سوت بر خطاها و پنالتی ها تأثیر می گذارد).
انگیزه/موقعیت مسابقات (اما مراقب «روایت» بدون شماره باشید).
2) تاریخچه جلسات چهره به چهره: زمانی که اهمیت دارد و زمانی که یک تله است
مفید است اگر:- سبک ها «هماهنگ نیستند»: تیم A در برابر فشار بالا سقوط می کند و حریف B یکی از رهبران PPDA است.
- مربیان ثابت و هسته تیم، تاکتیک ها کمی تغییر کرده اند، مسابقات اخیر (≤ 12-18 ماه).
- الگوهای تکرارپذیری وجود دارد (به عنوان مثال، حجم بالایی از استانداردها برای حریف به طور سیستماتیک xG را در برابر یک دفاع خاص ایجاد می کند).
- مسابقات باستانی و سایر مربیان/ترکیب = سطل زباله.
- نمونه های کوچک: 2-4 بازی سر و صدا هستند.
- «روانشناسی دربی» بدون تایید متریک.
تمرین: اگر سر به سر با داده های تازه (فرم، روند xG، ترکیب) مخالف باشد - اعتماد تازه، معیارهای فرآیند، نه نتایج قدیمی.
3) چگونه اطلاعات طولانی مدت و تازه را وزن کنید
پنجره کشویی: 10 تا 15 بازی آخر را به عنوان پایه فرم در نظر بگیرید.
کاهش وزن: بازی های اخیر - وزن بیشتر (به عنوان مثال، 1. 0 → 0. 9 → 0. 8…).
حریف آژاست: تنظیم آمار در قدرت مخالفان (بازی در برابر 5 بالا و در برابر خارجی ها را نمی توان به طور متوسط «به عنوان»).
4) رتبه بندی قدرت (Elo/معیار)
ایده: به هر تیم یک امتیاز داده می شود ؛ پس از مسابقه، با توجه به تعجب نتیجه و اهمیت مسابقه، بالا می رود/سقوط می کند.
مزایا: تطبیق پذیری، پارامترهای کمی، پایه خوبی را ارائه می دهد.
نحوه درخواست:1. ساخت/استفاده از Elo به پایان رسید.
2. تنظیم برای عامل خانه (اغلب ≈ + 0 در فوتبال. 20–0. 30 هدف در مدل ها در بسکتبال - جبران جداگانه در نقاط).
3. ترجمه تفاوت رتبه → احتمال برنده شدن از طریق تابع تدارکات.
4. با بازار چک کنید: جایی که احتمال شما> ضمنی ارزش بالقوه است.
5) مدل احتمالاتی ساده: مثالی برای فوتبال (پواسون)
وظیفه: ارزیابی شانس نمرات و نتایج دقیق.
مراحل:1. اهداف مورد انتظار تیم ها را ارزیابی کنید (\lambda _ A) و (\lambda _ B) (به عنوان مثال از xG برای قدرت دفاعی/تهاجمی و عامل خانه تنظیم شده است).
2. فرض کنید استقلال توزیع سر (ساده سازی، اما کار برای شروع).
3. احتمال یک تیم به ثمر رساند (K) اهداف:- (P (K = k) = e ^ {-\lambda }\frac {\lambda ^ k} {k!}).
- 4. سقوط توزیع برای به دست آوردن احتمال «P1/X/P2,» کل، و تعداد دقیق.
- فرض کنید (\lambda _ A = 1 {,} 55), (\lambda _ B = 1 {,} 10).
- (P_A (0) = e ^ {-1. 55 }\حدود 0 {,} 212), (P_A (1 )\تقریبا 0 {,} 329), (P_A (2 )\تقریبا 0 {,} 255).
- (P_B (0) = e ^ {-1. 10 }\حدود 0 {,} 333), (P_B (1 )\تقریبا 0 {,} 366), (P_B (2 )\تقریبا 0 {,} 201).
- با تا کردن (ضرب و جمع کردن تمام k)، احتمال نتایج و مجموع ها را بدست می آوریم (به عنوان مثال، (P (\text {TB} 2 {,} 5)) - مجموع تمام جفت ها (k_A+k_B\ge3)).
در عمل، استفاده از یک جدول تا اهداف 5-6، این 99٪ از موارد را پوشش می دهد.
مهم: اضافه کردن اصلاحات به:- «0-0» و تساوی (همبستگی گل های زده شده فرکانس تساوی در پواسون خالص را کاهش می دهد - می توانید یک عامل تساوی را معرفی کنید).
- کارت های قرمز، اهداف دیرهنگام، سبک مسابقه (سرعت و استانداردها بر توزیع تاثیر می گذارد).
6) ساخت ارزیابی «فرآیند» به جای «شمارش پذیر»
چرا «xG بهتر از نمره است»: نمره یک کل گسسته است، xG مجموع کیفیت لحظات است. این تیم می تواند «تولید» 2. 0 xG و به ثمر رساندن نیست «فرم بد»، اما پراکندگی.
رویکرد:- ساخت یک xG برای − xG در برابر روند با کاهش وزن.
- تنظیم برای قدرت حریف (حریف آژاست).
- مسابقه با نمره خام برای شناسایی تیم های بیش از حد خرید/فروش در بازار.
7) از داده ها به شرط بندی: یک چارچوب گام به گام
1. جمع آوری و تمیز کردن
آخرین 10-15 بازی + میانگین فصل.
ترکیب، مصدومیت، داور، آب و هوا، تقویم.
موارد عجیب و غریب آشکار را حذف کنید (بازی در اقلیت 60 دقیقه و غیره) یا آنها را علامت بزنید.
2. ارزیابی قدرت
امتیاز الو/قدرت + عامل خانه.
روند xG (یا معیارهای مشابه برای ورزش) با حریف آژاست.
3. مدل مطابقت
برای فوتبال: (\lambda _ A ,\lambda _ B) → پواسون ؛ برای بسکتبال - سرعت + eFG٪ + ORB/TO → پیش بینی امتیاز ؛ برای تنیس - قرعه کشی/بازی/مجموعه مدل احتمال.
شبیه سازی 10-50 هزار تکرار مونت کارلو (اگر شما می توانید) و توزیع نتایج/مجموع/شانس.
4. مقایسه با خط
ضریب → احتمال ضمنی (p_\text{imp}=1/k).
اگر (p_\text{vasha}> p_\text{imp}) نامزد ارزش هستند.
تخمین اندازه لبه: (\text {edge} = p_\text{vasha} - p_\text{imp}).
5. اندازه شرط و خطر
برای یک مبتدی: نرخ تخت 0. 5-1. 5 درصد از بانک
Semi-Kelly، اگر اعتماد به نفس در کالیبراسیون احتمالات.
6. حسابداری و اعتبارسنجی
مجله: تاریخ، بازار، کپی، (p_\text{vasha})، مقدار، نتیجه، نظر.
هفتگی: کالیبراسیون احتمال (10٪ سطل: از نرخ با نمره 60٪ باید ≈60٪).
آزمون A/B: مقایسه نتایج شرط ها «در حساب» در مقابل «در مدل xG».
8) عوامل کیفی که اعداد را تغییر می دهند
مسابقه و سبک. جناح سریع در برابر fullbacks آهسته، انتخاب و رول در برابر دفاع قوس ضعیف، یک تیم است که می دهد بسیاری از 3PA به حریف.
پیروزی های «مجموعه ای از پیروزی ها» اغلب این تقویم + شانس (PDO/تبدیل/صرفه جویی) است. تست استحکام از طریق معیارهای فرآیند.
چرخش و خستگی بازگشت به عقب و سفرهای طولانی باعث کاهش کارایی حمله و شدت دفاعی می شود.
9) چک لیست های کوچک
قبل از مسابقه
- صف بندی و وضعیت رهبر به روز شد
- فاکتور خانه روشن, آب و هوا/پوشش/داور
- محاسبه مجدد (\lambda )/رتبه بندی/احتمالات
- مقایسه با خط و حاشیه کتابفروشی
- یک ارزش قابل توضیح وجود دارد (چرا بازار اشتباه است ؟)
بعد از مسابقه
- به روز رسانی ورود (ref، (p)، نتیجه، xG/روند)
- علل انحراف ثبت شد (آسیب در 15th، قرمز، مجازات، «زمان زباله»)
- کالیبراسیون: آیا 55٪ من در واقع ≈55٪ است ؟
10) اشتباهات مکرر و چگونگی اجتناب از آنها
آموزش مجدد سر به سر راه حل: H2H محدودیت وزن و قانون محدودیت.
مارجین و بازار نادیده گرفته می شود. راه حل: همیشه حساب کنید (p_\text{imp}) و به دنبال لبه باشید، نه «پیش بینی برنده».
نمونه کوچک راه حل: حمایت از میانگین فصلی + کاهش وزن.
بدون اعتبار. راه حل: منحنی کالیبراسیون، backtest، ورود به سیستم.
آمار و تاریخ بازی کار زمانی که شما: (1) تکیه بر معیارهای فرآیند (xG، رتبه بندی کیفیت)، (2) تنظیم داده ها برای زمینه (خانه/دور، تقویم، داور، آب و هوا)، (3) تبدیل پیش بینی به احتمالات، و سپس آنها را با خط و حاشیه مقایسه، و (4) مدیریت ریسک به شیوه ای منظم و نگه داشتن یک مجله. سپس «تاریخ مسابقه» متوقف می شود مجموعه ای از اسطوره ها و تبدیل به یک ابزار برای پیدا کردن یک ارزش واقعی است.