Божомолдор үчүн статистиканы жана матч тарыхын кантип колдонуу керек
Макаланын көлөмдүү тексти
Статистика - ыктымалдык тили. Бул келечекти "болжолдоо" эмес, бирок сезим караганда жакшы мүмкүнчүлүктөрдү баалоого жардам берет. Беттештердин тарыхы - маалыматтардын маанилүү бөлүгү, бирок аны туура эмес чечмелөө оңой: майда үлгүлөр, "жеке жолугушуулардын сыйкыры", календардын таасири жана командалардын формасы сүрөттү бурмалайт. Төмөндө - чогултуу үчүн практикалык колдонмо, тазалоо жана негиздүү коэффициенттерди алуу үчүн статистиканы колдонуу жана value табуу.
1) Кандай маалыматтар чындап эле пайдалуу
Негизги командалык метриктер
Натыйжалар: жеңиш/тең чыгуу/жеңилүү, гол/упай айырмасы.
"Көз ирмемдердин сапаты": xG/xGA баскетбол, Shot Quality/Expected Goals for/against хоккей, Offensive/Defensive Rating баскетбол.
Темп/стили: ээлик кылуу, кол салуу темпи, өткөөл этаптары, басым, 3PA/pace (НБА).
Стандарттык жоболор, бурчтук, айып (футбол): көп учурда гол киргизүү мүмкүнчүлүгү бааланбай калган булак.
Жеке факторлор
Курамы: жаракаттар, дисквалификация, ротация, мүнөттүн чеги, лидерлердин кайтып келиши.
Синергия жана ролдору: ким көз ирмемдерди жаратат, ким айландырылат, ким коргоону тартат.
Контекст
Үй/чыгуу, учуу, календардын тыгыздыгы (НБАда back-to-back, футболдо 7 күндө 3 оюн).
Аба ырайы/жабуу/деңиз денгээлинен бийиктиги (шамал жана жамгыр ылдамдыгын жана тактыгын азайтат).
Калыстар/калыстар (ышкырык стили эреже бузууларга жана пенальтиге таасир этет).
Мотивация/турнирдик позиция (бирок сансыз "баяндоодон" сак болуңуз).
2) Бетме-бет жолугушуулардын тарыхы: качан маанилүү, качан - капкан
Пайдалуу, эгерде:- Стилдер "дал келбейт": А командасы жогорку басымга каршы кулайт, ал эми В атаандашы PPDA боюнча лидерлердин бири.
- Туруктуу машыктыруучулар жана курамынын өзөгү, тактикасы аз өзгөрдү, матчтар жакында болду (≤ 12-18 ай).
- Кайталануучу үлгүлөр бар (мисалы, атаандашынын стандарттарынын жогорку көлөмү системалуу түрдө конкреттүү коргоого каршы xG түзөт).
- Байыркы дан жана башка машыктыруучулар/курамы = таштанды.
- Чакан үлгүлөр: 2-4 оюндар ызы-чуу болуп саналат.
- "Психология Дерби" метрика менен тастыкталган жок.
Практика: эгерде head-to-head жаңы маалыматтарга (формага, xG-тренддерге, курамдарга) карама-каршы келсе - эски натыйжаларга эмес, жаңы, процесстик метриктерге ишениңиз.
3) Эски жана жаңы маалыматтарды кантип таразалоо керек
Жылма терезе: 10-15 форманын базасы катары акыркы матчтарды алыңыз.
Жоготуу салмагы: акыркы оюндар - көбүрөөк салмак (мисалы, 1. 0 → 0. 9 → 0. 8…).
Оппонент-аджаст: атаандаштарынын күчү боюнча статистиканы тууралаңыз (топ-5ке каршы жана аутсайдерлерге каршы оюндар "мурдагыдай" орточо болушу мүмкүн эмес).
4) Күч рейтинги (Elo/көрсөтмөлөр)
Идея: ар бир командага рейтинг берилет; матчтан кийин ал матчтын жыйынтыгы күтүлбөгөн жана маанилүүлүгүн эске алуу менен жогорулайт/төмөндөйт.
Артыкчылыктары: көп жактуулугу, аз параметрлери, ошондой эле негизги "сызык" берет.
Кантип колдонуу керек:1. даяр Elo куруу/колдонуу.
2. Үй факторуна тууралоо (футболдо көп ≈ + 0. 20–0. 30 максаттары моделдер; баскетбол - көз айнек менен өзүнчө жылыш).
3. Рейтинг айырмасын которуңуз → логистикалык функция аркылуу жеңүү ыктымалдыгы.
4. базар менен салыштыруу: кайда сиздин ыктымалдыгы> implicite - потенциалдуу value.
5) жөнөкөй ыктымалдык модели: баскетбол үчүн үлгү (Пуассон)
Максаты: так эсептердин жана натыйжалардын мүмкүнчүлүктөрүн баалоо.
Кадамдар:1. Командалардын күтүлгөн максаттарын баалоо (\lambda _ A) жана (\lambda _ B) (мисалы, xG, коргоо/чабуул күчү жана үй фактору боюнча туураланган).
2. Баштарды бөлүштүрүүнүн көз карандысыздыгын (жөнөкөйлөтүү, бирок баштоо үчүн иштөө).
3. Команда (k) гол киргизүү ыктымалдыгы:- (P(K=k) = e^{-\lambda}\frac{\lambda^k}{k!}).
- 4. "P1/X/P2" ыктымалдыгын алуу үчүн бөлүштүрүүнү кыскартуу, жалпы жана так эсептер.
- Болсун (\lambda _ A = 1 {,} 55), (\lambda _ B = 1 {,} 10).
- (P_A(0)=e^{-1. 55}\approx 0{,}212), (P_A(1)\approx 0{,}329), (P_A(2)\approx 0{,}255).
- (P_B(0)=e^{-1. 10}\approx 0{,}333), (P_B(1)\approx 0{,}366), (P_B(2)\approx 0{,}201).
- Бурулуп (бардык k боюнча көбөйтүп жана жалпылап), натыйжалар жана тоталдар ыктымалдыгын алабыз (мисалы, P (\text {ТБ} 2 {,} 5) - бардык түгөйлөрдүн суммасы (k_A+k_B\ge3)).
- "0-0" жана чүчүкулак (гол корреляциясы таза Пуассондо чүчүкулак жыштыгын азайтат - чүчүкулак факторун киргизсе болот).
- Кызыл карталар, кеч максаттар, матч стили (темп жана стандарттар бөлүштүрүүгө таасир этет).
6) "Эсептөө" ордуна "процесстик" баалоону куруу
Эмне үчүн "xG эсептен жакшы": эсеп - дискреттик жыйынтык, xG - көз ирмемдердин сапатынын суммасы. Команда 2. 0 xG жана балл эмес - бул "жаман түрү" жана дисперсия эмес.
Ыкма:- Кыскартуу салмагы менен xG дифференциал (xG For − xG Against) тенденциясын куруу.
- Атаандашынын күчүн оңдогула (атаандаш-аджаст).
- Рынокто ашыкча/ашыкча сатылган команданы аныктоо үчүн "чийки" эсеп менен салыштырыңыз.
7) чен боюнча маалыматтар: кадам Framework
1. Чогултуу жана тазалоо
Акыркы 10-15 оюндар + сезондук орточо.
Курамы, жаракат, сот, аба ырайы, календары.
Ачык эмиссияларды алып салыңыз (азчылыкта оюн 60 мүнөт ж.б.) же аларды белгилеңиз.
2. Күч баалоо
Elo/Power Rating + үй жагдай.
Trend xG (же спорт үчүн окшош метриктер) менен атаандашы-adjast.
3. Матч модели
Футбол үчүн: (\lambda _ A ,\lambda _ B) → Пуассон; баскетбол үчүн - темп + eFG% + ORB/TO → упай болжолдоо; теннис үчүн - чүчүкулак/оюн/сеттин ыктымалдык модели.
10-50 000 Монте-Карло итерациясын моделдеңиз (эгер билсеңиз) жана натыйжаларды/тоталдарды/алдын ала бөлүштүрүүнү алыңыз.
4. Сызык менен салыштыруу
Коэффициент → имплициттик ыктымалдык (p_\text{imp}=1/k).
Эгер (p_\text{ваша}> p_\text{imp}) value үчүн талапкерлер.
edge өлчөмүн баалоо: (\text {edge} = p_\text{ваша} - p_\text{imp}).
5. Чен өлчөмү жана тобокелдик
Үйрөнчүк: flat-чен 0,5-1,5% банк.
Пол-Келли, эгерде сиз ыктымалдуулукту калибрлөөгө ишенсеңиз.
6. Эсепке алуу жана валидация
Журнал: дата, рынок, коэф, (p_\text{ваша}), сумма, жыйынтык, комментарий.
Жума сайын: ыктымалдыгын калибрлөө (бакеттер 10% боюнча: 60% баа менен коюмдардын ичинен 60% ≈ кириши керек).
A/B-тест: xG-модель боюнча "vs" эсеби боюнча "коюмдардын натыйжаларын салыштырып көрүңүз".
8) Сандарды өзгөрткөн сапаттык факторлор
Матч-ап жана стили. Fast флангдар каршы жай fulbekov, "пик-н-ролл" каршы алсыз коргоо жаа, каршы көп 3PA берген команда.
"Жеңиш сериясы". Көбүнчө бул календарь + ийгилик (PDO/conversion/сактык). Процесстик метриктер аркылуу туруктуулукту текшериңиз.
Айлануу жана чарчоо. Back-to-back жана алыскы сапарлар чабуулдун натыйжалуулугун жана коргонуу интенсивдүүлүгүн азайтат.
9) Mini чек барактар
Беттештин алдында
- такташты курамы жана лидерлери статусу
- такталган үй фактору, аба ырайы/камтуу/сот
- Кайра эсептелген (\lambda )/рейтингдер/ыктымалдыгы
- сызык жана букмекер маржа менен салыштыруу
- түшүнүктүү value бар (эмне үчүн базар туура эмес?)
Матчтан кийин
- Журнал жаңыланды (coef, (p), жыйынтык, xG/процесс)
- Белгиленген четтөө себептери (15-травма, кызыл, айып, "таштанды убактысы")
- калибрлөө: менин 55% чын эле 55% ≈ келет?
10) көп каталар жана аларды качуу үчүн кантип
Head-to-head боюнча кайра даярдоо. Чечим: H2H салмагынын чеги жана эскирүү мөөнөтү.
Ignor маржа жана базар. Чечим: ар дайым (p_\text{imp}) санап, "жеңүүчүнү болжолдоо" эмес, edge издеңиз.
Чакан үлгү. Чечим: таяныч сезондук орточо + салмак жоготуу.
валидация жок. Чечим: калибрлөө ийри, backtest, журнал.
Статистика жана матчтардын тарыхы сиз иштегенде: (1) процесстик метрикага таянуу (xG, сапат рейтинги), (2) контекстке карата маалыматтарды тууралоо (үй/чыгуу, календарь, калыс, аба ырайы), (3) прогнозду ыктымалдыкка айландыруу, андан кийин аларды линия жана маржа менен салыштыруу, жана (4) тобокелдикти тартиптүү башкаруу жана жүргүзүү журнал. Анда "матч тарыхы" уламыштардын жыйындысы болуп калат жана чыныгы value издөө куралына айланат.