چگونه برای پیش بینی عملکرد ورزشی با داده ها

پیش بینی در ورزش یک «حدس» نیست، بلکه یک ارزیابی سیستماتیک از احتمالات است. مهم نیست که نمره دقیق را پیش بینی کنید، بلکه قیمت مناسب را برای نتیجه با عدم اطمینان خاصی خریداری کنید. در زیر یک فرایند گام به گام است: از جمع آوری داده ها و ویژگی های ساختمان به کالیبراسیون و مبارزه با عملیات.

1) داده ها: پایه مدل

منابع و منابع

مسابقه: ترکیب، آسیب، رد صلاحیت، برنامه (b2b/پرواز)، وضعیت خانه/دور، آب و هوا/سطح/عرصه، داوران.

ردیابی/رویدادهای بازی: بازی توسط بازی، مختصات، حوادث (گوشه، خطا، پرتاب، پاس).

معیارهای پیشرفته: xG/xA (فوتبال)، eFG ٪/pace/ORB (بسکتبال)، DVOA (فوتبال آمریکایی)، bullpen/park factors (بیس بال)، map pool/patches (esports).

بازار: حرکت خطوط که ضرایب نزدیک (CL)، مقدار پول - مفید برای علامت گذاری «مرجع» احتمال.

داستان تیم/بازیکن: آخرین بازی فرم N، سبک H2H، دقیقه/مدل بار.

با کیفیت بودن

همگام سازی مناطق زمانی و انواع ساعت (زمان رویداد در مقابل زمان پردازش).

حذف تکراری، پر کردن شکاف با قوانین مستند.

منابع «حقیقت» را برای آمار نهایی تعیین کنید (به عنوان مثال، آنچه که xG/strike رسمی در نظر گرفته می شود).

2) ما مشکل را حل می کنیم

انواع اهداف

طبقه بندی: برنده/قرعه کشی/از دست دادن ؛ «هر دو گل خواهند زد» ؛ که آیا در این میان شکستی در کار خواهد بود یا نه.

نمره/شدت: اهداف/امتیازات مورد انتظار (دوجملهای پواسون/منفی).

پیش بینی توزیع: مجموع، شاخص های فردی (CRPS به عنوان متریک کیفیت).

props بازیکن: نقاط/کمک/aces/yards - رگرسیون با اثرات سلسله مراتبی (مخلوط).

افق دید

Prematch (T-دقیقه برای شروع).

Live (در طول رویداد) - ویژگی های جریان و محدودیت های تاخیر را اضافه می کند.

3) Feechee: چه چیزی واقعا نتیجه را توضیح می دهد

سطح تیم

قدرت (Elo/PRI)، تفاوت کیفیت تهاجمی/دفاعی.

سرعت (سرعت)، سبک (فشار دادن/بلوک کم ؛ نرخ 3PT ؛ مخلوط عجله/عبور).

فرم و «خستگی» (دقیقه/بار، B2B، سفر).

تیم های ویژه: PP/PK در هاکی، تیم های ویژه در فوتبال آمریکایی.

سطح بازیکن

دقیقه/مدل مشارکت، نقش (استفاده)، اثربخشی (eFG٪، OBP، xwOBA).

ترکیبات: اثر ترکیبات خاص از پنج/لینک.

زمینه کاری

آب و هوا/سطح/عرصه، مشخصات داور (خطا/مجازات).

انگیزه مسابقات (بقا، پلی آف، چرخش قبل از مسابقات اروپایی).

بازار فروش

خطوط/مجموع/شانس، گسترش بین اپراتورها، حرکت به بسته شدن (اطلاعات پروکسی).

4) مدل ها: از کلاسیک به شبکه های عصبی

طبقه بندی/احتمالات

رگرسیون لجستیک (معیار کالیبراسیون پایه).

تقویت گرادیان (XGBoost/CatBoost/LightGBM) یک استاندارد جدولی قوی است.

شبکه های عصبی (MLP) - با تعداد زیادی از غیرخطی ها و تعاملات.

نمره/شدت

پواسون/پواسون دو بعدی (فوتبال، هندبال).

دوجملهای منفی (overdispersion)

مدل سلسله مراتبی برای بازیکنان/تیم (تجمع جزئی).

توالی/زنده

RNN/GRU/Temporal CNN و ترانسفورماتور برای بازی با بازی، حرکت و تغییرات سرعت.

به روز رسانی شدت زمان واقعی بیزی.

رتبه بندی ها

Elo/Glicko به صورت پویا قدرت را منعکس می کند. می تواند با انباشته شدن ترکیب شود.

5) کالیبراسیون و تفسیر

چرا کالیبراسیون ؟ احتمالات باید با فرکانس های واقعی منطبق باشند.

کالیبراسیون Platt/Isotonic/Beta بیش از پیش بینی های خام.

نمودارهای کالیبراسیون، نمره بریر، LogLoss - معیارهای اساسی.

تفسیر پذیری: اهمیت جایگشت/SHAP برای کنترل تغییرات و حس مشترک.

6) اعتبار صادقانه: بدون آن، هر چیز دیگری بی معنی است

پیاده روی به جلو (پنجره کشویی)

تقسیم بر زمان: قطار → اعتبار → آزمون وارد گذشته نشو.

حداقل 3-5 «اجاره» از پنجره برای درک ثبات.

جلوگیری از نشت

از ویژگی های فاکتور استفاده نکنید (xG نهایی مسابقه هنگام پیش بینی شروع مسابقه).

در زندگی می کنند - ویژگی های تنها تا زمان فعلی در دسترس هستند.

جدا کردن «قبل از اعلام ترکیب» و «بعد»: این حالت های مختلف هستند.

معیارهای اندازه گیری

احتمالات: Brier/LogLoss + کالیبراسیون.

رگرسیون: MAE/RMSE/CRPS.

معیارهای کسب و کار: نرخ با آستانه قیمت، ثبات در گروه های لیگ/فصل.

7) احتمال تصمیم گیری: قیمت و استراتژی

حاشیه پاک (در اطراف)

در بازار 1X2، مجموع احتمالات «کثیف»> 100٪ است. نرمال سازی متناسب برای به دست آوردن «صادقانه» (p ^ {fair}).

ارزش и EV

لبه: (\text {edge} = p\cdot d - 1).

تنظیم فقط اگر لبه آستانه ≥ (به عنوان مثال، 3-5٪).

اندازه شرط بندی

تخت 0. 5-1٪ برای تک ؛ کمتر - در قطار اکسپرس.

کسر کلی: (f =\frac {p d - 1} {d - 1})، اغلب ¼ استفاده میشود - ½ کلی به دلیل واریانس و خطاها (p).

CLV به عنوان معیار کیفیت

قیمت خود را با قیمت بسته شدن مقایسه کنید. CLV + بلند مدت نشانه یک الگوی سالم و زمان بندی است.

8) پیش بینی زنده: سرعت و «پنجره ها»

خط لوله

رویداد → ویژگی به روز رسانی → استنتاج آنلاین → بررسی ریسک → انتشار.

اهداف تاخیر: استنتاج <0. 8s، چرخه به روز رسانی 0. 5-2 ثانیه

ویژگی های زمان واقعی

سرعت/مالکیت، خطا/کارت، خستگی، تیم های ویژه، چرخه اقتصادی در ورزش های الکترونیک.

حالت تعلیق در لحظات «تیز» ؛ مدل ها باید بتوانند «سکوت کنند».

تمرین کنید

به دنبال خطوط «بیش از حد» بلافاصله پس از رویدادهای میکرو (10-0 حرکت تند و سریع، شکست زودهنگام)، اما تأخیر جریان را در نظر بگیرید - منطق خرید، نه یک تصویر.

9) موارد کوچک توسط ورزش

فوتبال (مجموع/نتایج)

Fici: xG برای مسابقات 8-12 (وزن)، سرعت و سبک جفت، داور (پنالتی/کارت)، چرخش.

مدل: پواسون دو بعدی با فاکتور خانه + کالیبراسیون.

نتیجه گیری: پیش بینی توزیع اهداف → قیمت کل/خطوط آسیایی.

بسکتبال (مجموع/غرفه)

ویژگی ها: سرعت، eFG٪، ORB/DRB، خطا/پاداش، روال دقیقه.

مدل: افزایش برای کل ؛ برای props - رگرسیون سلسله مراتبی از دقیقه × بهره وری.

نتیجه گیری: احتمال مناطق کل، میانه ها/چندک ها برای امتیاز بازیکنان.

تنیس (خروج/بازی ها)

ویژگی ها: پوشش، نگه داشتن/شکستن٪، دوم خدمت با کیفیت، خستگی.

مدل: مارکوف در نقاط/بازی + تدارکات «لایه» در شکل ؛ کالیبراسیون.

نتیجه گیری: احتمال پیروزی/کراوات شکستن، مجموع بازی ها، به روز رسانی زنده برای هر خدمت.

ورزش های الکترونیک (نقشه ها/دور)

ویژگی ها: کارت استخر، ممنوعیت/اوج، چرخه اقتصادی، خستگی LAN، تکه.

مدل: تقویت/ترانسفورماتور توسط رویداد ؛ برای کارت - طبقه بندی + CRPS برای دور.

نتیجه گیری: برنده کارت، مجموع دور، «اولین خون/جسم».

10) MLOps و عملیات (پیشرفته)

Fichstore: سازگاری آفلاین/آنلاین، سفر در زمان برای backtests صادقانه.

نسخه بندی داده ها/مدل، CI/CD، نسخه های قناری.

مانیتورینگ: رانش داده ها، تخریب کالیبراسیون، تأخیر استنتاج.

آزمایشات: A/B بدون SRM، CUPED/diff-in-diff، معیارهای توقف از پیش تعیین شده.

Fail-safe: خطوط عقب نشینی و قوانین دستی برای حوادث خوراک.

11) اشکالات و ضد الگوهای

نشت: نشانه هایی از آینده، معیارهای پس از واقعیت در prematch.

بازآموزی: مدل بیش از حد پیچیده در یک مجموعه داده کوچک ؛ با تنظیم، چک کردن زمان حل می شود.

تعصب Recency: ارزیابی مجدد مسابقات اخیر ؛ استفاده از وزن نمایی با حداکثر محدودیت.

لنگر انداختن: ضربه زدن به خط اول ؛ مقایسه با قیمت «صادقانه» مدل.

نادیده گرفتن کالیبراسیون: یک مدل «دقیق» با احتمال منحنی EV را خراب می کند.

حالت مخلوط کردن: «قبل از ترکیب» و «بعد» - مدل های مختلف.

12) چک لیست

قبل از آموزش

1. داده ها به موقع پاک و هماهنگ می شوند.

2. بیانیه هدف: آنچه ما پیش بینی می کنیم و چرا (چه تصمیمی می گیریم).

3. قطار تقسیم/معتبر/زمان آزمون تنها.

4. مدل معیار پایه (لجستیک/پواسون).

قبل از انتشار

1. کالیبراسیون تایید شده (Brier/LogLoss، طرح قابلیت اطمینان).

2. Walk-forward در فصل ها/لیگ ها پایدار است.

3. هیچ نشتی وجود ندارد، ویژگی ها در prod در دسترس هستند.

4. نظارت بر رانش و overtraining وجود دارد.

قبل از شرط بندی

1. حاشیه حذف شده، لبه ≥ آستانه.

2. نرخ اشتراک مسطح/کلی.

3. برنامه ارزیابی کیفیت - ردیابی CLV.

4. درک قوانین محاسبه (OT/VAR/push/void).

13) اخلاق و مسئولیت

مدل ها یک ابزار هستند، نه یک دکمه پول. به محدودیت زمان/پول احترام بگذارید، مکث کنید، از منابع داخلی/نادرست استفاده نکنید و به یاد داشته باشید که حتی مدل کامل در مسابقات فردی اشتباه است. هدف شما یک مزیت از راه دور است، نه یک «ضربه 100٪».

پیش بینی عملکرد ورزشی با داده ها یک چرخه است: داده ها → ویژگی ها → مدل → کالیبراسیون → اعتبار سنجی صادقانه → تصمیم قیمت → پس از تجزیه و تحلیل. عجیب و غریب نباشید: یک معیار باریک، داده های تمیز و احتمالات کالیبره شده اغلب قوی تر از معماری های «مد روز» هستند. اضافه کردن پیچیدگی تنها زمانی که آن را می دهد افزایش مداوم در کیفیت در راه رفتن به جلو و بهبود CLV. کمتر، اما بهتر - و فاصله شروع به کار برای شما.