Узак мөөнөттүү оюнда стратегиянын натыйжалуулугун кантип баалоо керек
Узак аралыкта стратегиянын натыйжалуулугу - бул "бактылуу/бактысыз кечинде" эмес, өзгөрүүсүз эрежелер менен көптөгөн көз карандысыз сегменттерде көрсөткүчтөрдүн туруктуулугу. Төмөндө - интуицияны өлчөнүүчү метриктерге, кайталануучу тесттерге жана чынчыл корутундуларга которгон жумушчу кадр.
1) Биринчи - максат жана гипотеза
Ийгиликтин конкреттүү критерийин жана горизонтту аныктаңыз:- Максаты: "90-перцентилди минималдаштыруу", "медианалык жыйынтыкты 1000 спинге көбөйтүү", "марага жетүү мүмкүнчүлүгүн 0% ≥ жогорулатуу".
- Гипотеза: "А стратегиясы 1000 спин батчеге Б стратегиясына карата 3 п.п. ≥ жогору жай жыйынтык берет".
- Горизонт: батчанын узундугу (мисалы, 1000 спин) жана батчалардын саны (туруктуу корутундулар үчүн кеминде 30-50).
Маанилүү: эгерде RTP <100% жана тышкы артыкчылыгы жок болсо, "натыйжалуулук" = көбүрөөк алгылыктуу тобокелдик профили (төмөндөө, квантилдер, максаттардын мүмкүнчүлүгү), күтүүнүн кереметтүү өзгөрүшү эмес.
2) Туура метрика "карыз"
1. батч үчүн EV (орточо баасы/%) - багытын көрсөтөт.
2. Медиана жана натыйжа квантилдери (Q50/Q75/Q90) - "кадимки" жана "жаман" сыяктуу (оюнчу медианада жана куйрукта жашайт).
3. Банктын өсүү темпи:- сызыктуу: орточо% батч үчүн, лог-өсүү (орточо 'ln (Bt/Bt − 1)'), тиешелүү, эгерде коюмдун фракциясы банкка көз каранды болсо.
- 4. Кыйроо коркунучу: банкрот/стоп-лосс менен батчалардын үлүшү.
- 5. Max drawdown (тереңдиги жана узактыгы) - медиана жана 90-перцентил.
- 6. "Маанилүү окуялардын" жыштыгы (≥ × 10, бонус) жана күтүү интервалдары (медиана, 75-перцентил) - пландаштыруу үчүн.
- 7. Убакыттын туруктуулугу: батчалар ортосундагы метриктердин дисперсиясы, вариация коэффициенти.
- "Шарп-окшош" метрика: батч үчүн орточо жыйынтык/стандарттык четтөө.
- Келли шайкештик (edge бар болсо): тандалган чен үлүшү Келли четтеп канча; недо/кайра бөлүштүрүү үчүн айып пул.
3) Эксперименттин дизайны: жыйынтыктар чынчыл болушу үчүн
Батчинг: оюнду бирдей узундуктагы көз карандысыз терезелерге бөлүңүз (мисалы, 1000 спин).
A/A-тесттер: A/B чейин ошол эле стратегиясы менен система "айырмачылыктарды көрө албайт" (жалган коопсуздук).
Out-of-sample: батч бир топтому боюнча эрежелерди орнотуу, текшерүү - башка (эч кандай "бардык маалыматтарды карап кийин пайда болгон эрежелер").
Жалпы кокустук сандар (CRN) симуляцияларда: стратегиялар бир эле ызы-чуу менен салыштырылат.
Белгиленген чыгуу эрежелери: тейк-пайда/стоп-лосс, L-streak кийин тайм-аут - тест башталганга чейин жазылган.
4) Ката жана көлөм: канча "узундугу" керек
Батчу орточо ката (1/\sqrt {M}) төмөндөйт, мында (M) - батчалардын саны. Болжолдуу маалыматтар:- 30-50 батч ≈/квантилинин "таанымал" болушу үчүн минималдуу.
- Оор куйруктар үчүн (жогорку туруксуздук, сейрек ири утуштар) - 100 батч.
- орточо/медиа айырмачылыктар стратегияларын салыштыруу үчүн t-тест гана эмес, бир бутстреп же өзгөртүү тестин колдонуу.
5) Стратегияларды салыштыруу үчүн кантип (A vs B)
1. Батч боюнча метрика (жыйынтык%, max DD, мүмкүнчүлүк ≥ 0%).
2. айырмасы (\Delta =\text {метрика} _ A -\text {метрика} _ B) ар бир батч (CRN/жуп батчи болсо, жуп).
3. Butstrap 95% DY үчүн (\Delta) жана өзгөртүп сыноо (p-value) - нормалдуулук жөнүндө эч кандай божомолдор менен туруктуу текшерүү.
4. Клиникалык маанилүү дельта: алдын ала босогону белгилеңиз, андан төмөн айырма "стратегияны татаалдаштырууга арзыбайт".
6) Жылыштарды жана туруктуулукту көзөмөлдөө
Узак мөөнөттүү чөйрө өзгөрөт: RTP версиялары, провайдер пулу, акциялар/кэшбэк, спиндердин ылдамдыгы.
CUSUM/Control Cards: жылдыруу байкоо үчүн метриканын узак мөөнөттүү орточо четтөөлөрдүн суммасына мониторинг жүргүзүү.
Жылма терезелер: акыркы 20-30 батам боюнча отчеттор - эрте эскертүү.
Стратификация: слоттор/туруксуздук/акция убактысы боюнча өзүнчө катарлар.
7) Акча экономикасы: баарын эске алуу
Стратегиянын натыйжалуулугу - "аркасы" гана эмес. Киргизүү:- Кэшбэк/рейк-бек/миссиялар/турнирдик упайлар: "коюмдарды" же% кайра эсептөө.
- Убакыттын баасы/лимиттери: узун сессиялар = куйругуна жогору экспозиция.
- Провайдердин комиссиялары/валютаны конвертациялоо/лимиттери: реалдуу EV жана тобокелдикке таасир этет.
8) Келли жана өсүү темпи (пайда болгондо)
Эгерде сизде тышкы edge (чыныгы оң EV) болсо, максаттуу метрика - банктын орточо лог-өсүшү.
Келлинин үлүшү логикалык өсүштү максималдуу кылат, бирок агрессивдүү; көп учурда туруксуздукту азайтуу үчүн "Келлинин жарымын" колдонушат.
Терс күтүүдө оптималдуу үлүшү - 0: "натыйжалуулук" пайдага эмес, тобокелдикти/ырахатты башкарууга алып келет.
9) узак капкан
Кайра даярдоо ("ылайыкташтырылган" эрежелер тарых). чечим: out-of-sample жана алдын ала протокол бекитүү.
Бир нече салыштыруу (ондогон стратегияларды сынап, "мыкты" тандап). Чечим: оңдоолор (Bonferroni/FDR) же тандоо жана валидация менен "лига".
Аман калган адамдын жылышы: Сиз "аман калган" стратегияны гана көрөсүз. Тарыхты сактаңыз жана жабылгандарды жашырбаңыз.
Батчеде ченди/слотту өзгөртүү: салыштырууну бузат.
"Ийгиликке" токтотуу: "биринчи плюс" сыноо бөлүштүрүүнү бурмалайт.
10) Мини-баалоо протоколу (регламентке киргизилиши мүмкүн)
1. Башталганга чейин: максат, метрика, батч узундугу, батч саны, кирүү/чыгуу эрежелери, баалуулук критерийи, бул ийгилик деп эсептелет.
2. Жыйноо: спин логи (коюм, төлөм, ≥ желектери × 10/бонус), батч жыйынтыгы, max DD, узактыгы.
3. Аналитика: Медиана жана натыйжалар квантилдери, кыйроо коркунучу, күтүү интервалдары, ДИ бутстрэп, A/B үчүн алмаштыруу тесттери
4. Туруктуулук: CUSUM, жылма терезелер, стратификация.
5. Отчет: таблица метриков, ДИ, корутунду "дельта жетиштүү мааниге ээ", чен жана лимиттер боюнча сунуштар.
6. Чечим: "Өндүрүмдүү "/" Дагы 30 маалымат батч "/" Архив".
11) "Стратегиянын паспорту (long-run)" - даяр шаблон
Стратегия/эрежелер версия: .../...
Slot/куржунунун жана RTP-бассейн:...
Батч: 1000 спин; батчей:...
EV (батам орточо): ...% [95% ди... -...]
Орточо натыйжасы (Q50 )/IQR: ... %/... -...%
Максаттар мүмкүнчүлүгү: ≥ 0%...%; ≥ + 20%...%
Max drawdown: медиа... коюмдар; 90-percentile...
≥ × 10 чейинки интервалдар: медиана... спины; 75-percentile...
Батч боюнча кыйроо коркунучу: ...%
база менен салыштыруу (flat): (\Delta) EV... p.p. [butstrep ди... -...; p-өзгөрүүлөр =...]
Туруктуулук: CUSUM - drift/жок; жылма терезе - ок.
Кэшбэк менен экономика: +... б.б. к EV (эсептөө ыкмасы -...).
Чечим: киргизүү/бүтүрүү/четке кагуу.
Эскертүү: маалыматтарды чектөө, чөйрөнү өзгөртүү.
12) "стратегия натыйжалуу" чыгаруу алдында кыска чек тизмеси
out-of-sample ырастоо барбы?
DY/quantiles/төмөндөшү гана эмес, орточо көрсөтүлгөн?
Тышкы бонустар/кэшбэк эске алынабы?
A/A тесттен өттүбү (система фантомдук дельталарды "көрбөйт")?
түзөтүүсүз бир нече тестирлөө барбы?
Стратегия бирдей шартта жашайбы (RTP, чендер, лимиттер)?
Жыйынтык: узак мөөнөттүү натыйжалуулук - бул өлчөө дисциплинасы жөнүндө. Максатты белгилөө, мушташтарга тестирлөө, стратегияларды туура салыштыруу (бутстреп, өзгөрүүлөр, CRN), орточо гана эмес, ошондой эле квантилдер, чөгүүлөр жана тобокелдиктерди көрсөтүү. Кэшбэк жана дрейф чөйрөсүн эске алып, протоколду өзгөрүүсүз калтырыңыз. Ошентип, стратегия сезимдердин жыйындысы болбой калат жана узак аралыкта түшүнүктүү тобокелдик профили менен башкарылуучу куралга айланат.
