Ինչպես Science-ը օգնում է բացահայտել խաղացողների կախվածությունը
1) Ինչո՞ ւ է դա անհրաժեշտ
Խաղային կախվածությունը դրսևորվում է ոչ թե մեկ օրվա ընթացքում, առաջին հերթին ավանդները և նստաշրջանների հաճախությունը աճում են, ապա փոխվում է խաղի ոճը (դոգոն, աճը, գիշերը խաղը), հայտնվում են անտեսված սահմաններ։ Windows Science-ի խնդիրն այն է, որ նկատեք ռիսկի արտոնագրերը ավելի շուտ, քան նրանք հանգեցնում են ֆինանսական և հոգեբանական վնասի, և առաջարկել անձնական միջամտություններ, պահպանելով հավասարակշռությունը բիզնեսի պատասխանատվության և խաղացողի ինքնավարության միջև։
2) Ի՞ նչ տվյալներ ենք օգտագործում (և ինչպե՞ ս պատրաստել դրանք)
Աղբյուրները
Նստաշրջանների լոգները 'մուտքերի հաճախությունը, տևողությունը, ընդմիջումները, օրվա ժամանակը, սարքերը։- Գործարքները 'դեպոզիտներ/եզրակացություններ, վճարման մեթոդներ, վճարումներ, chargeback-stugers։
- Խաղային հեռուստատեսություն 'տոկոսադրույքներ, արցունքների անկայունություն, խաղերի տեսակներ, խաղերի միջև անցումներ։
- RG ազդանշաններ (Responsible Gaming): Տեղադրումներ/փոփոխություններ սահմաններ, ռելալ-time հիշեցումներ, ինքնախաբեություն։
- Աջակցության ծառայություն 'կոչերը, ձգանողները «կորցրեցին վերահսկողությունը», տոնայնությունը (եթե խաղացողը համաձայնվեց վերլուծության համար)։
- Համատեքստը 'գեո/ժամ գոտի, սեզոնային, հանգստյան/արձակուրդներ։
Ֆիչին (օրինակներ)
Ավանդների և միջին տոկոսադրույքի աճի արագությունը (գրադիենտներ, էքսպոնենցիալ հարթեցում)։- Նստաշրջանների ռիթմը 'քրոնոպոդոգրաֆիա (feature hashing շաբաթվա ժամերին), գիշերային պիկի։
- Patterns dogon-2019-ը 'N-ի կորցնելուց հետո ավելացումը մեկ անգամ անընդմեջ։
- Բազմազանության նվազումը (entropy of game choice) 'մեկ կամ երկու ռիսկային խաղերում։
- Ֆրիցիա/հոգնածություն 'փոքր ավանդների հաճախության աճը, սարդի անտեսումը, եզրակացությունների վերացումը։
- RG-ի ձգողականները 'լիմիտի տեղադրումը մեծ պարտությունից անմիջապես հետո, լիմիտների հաճախակի փոփոխություններից հետո։
Տվյալների որակը
Surrogate յուրահատուկ ID, PII նվազեցումը։- Ֆիչեստորը (feature store) տարբերակով և SLA ուշացումով։
- Վալիդացիայի միջոցով 'anomali, dedupliation, սահմաններ (e. g., բացասական դեպոզիտներ)։
3) Ինչպե՞ ս կարելի է նշել «կախվածությունը», եթե կատարյալ պայծառություն չկա։
Proxy-labeling: Ինքնախաբեություն, երկար «Time-uta», աջակցություն հիմնական արտահայտություններին, սահմանների գերագնահատումը ոչ թե իդեալական է, այլ օգտակար։
Թուլացած իրադարձությունները 'հազվագյուտ, այդ իսկ պատճառով հարմար են semi-supervised և PU-learning (positive & unlabeled)։
Ռիսկի փորձագիտական սանդղակը 'կլինիկական հարցաթերթիկները (եթե խաղացողը համաձայնվի), որոնք համախմբված են երկուական/մուլտիկլադային թարգետի մակարդակին։
4) Մոդելներ և մոտեցումներ
Սուպերմարկետի դասական
Գրադիենտ բուստինգը, լոգիստիկ ռեգրեսիա բազային սկորինգի համար (մեկնաբանություն, արագ անցում)։- Հավանականության տրամաբանությունը (Platt/Isotonic) միջամտությունների ճիշտ շեմերի համար։
Հաջորդականությունները և ժամանակը
RNN/Transformer/Temensal CNN-ը նստաշրջանների և նստարանների շարքերի համար։- Սայթաքող պատուհանները, rolling features և attention դեպի «սուր» դրվագներ (գիշերային դոգոն)։
- Survival-anensis (Cox, RSF): ժամանակը մինչև անցանկալի իրադարձությունը (ինքնախաբեություն) որպես target։
Առանց ուսուցչի
Վարքագծային դերերի կլաստերիզացիա (k-means, HDBSCAN)։- Անոմալիաների հայտնաբերումը 'Isolation Forest, One-Class SVM, Autoencoder։
Պատճառն ու uplift
Causal-մեթոդները (DID, Causal Forest) և uplift մոդելները, որոնք իսկապես նվազեցնում են ռիսկը կոնկրետ խաղացողի համար։
Մեկնաբանությունը
SHAP/Permutation import.ru + նշանների կայունացումը, RG-թիմի զեկույցները։
5) Որակի և ապրանքի մետրիկները
Մոդելային (off-2019)
AUC-PR (ավելի կարևոր է, քան ROC հազվագյուտ իրադարձությունների ժամանակ), F1/Recall @ Precision, calibration error։
Time-event concordae-ը survival մոդելների համար։
Բիզնեսը և RG-մետրիկները (on-2019)
Time-to-intervention: Որքա՞ ն շուտ է համակարգը միջամտել «վատ» իրադարձություններին։
Խաղացողների մասնաբաժնի նվազումը 30/60/90 օրվա հորիզոնում։
Կորցնելուց հետո ռուսական եզրակացությունների նվազումը, գիշերային նստարանների նվազումը 00: 00-07: 00։
Harm-reduction KPI-ը, որը տեղադրեց լիմիտներ և պահպանեց դրանք։- Cost of false positives: «չզգալ առողջ» - էսկալացիայի մասը առանց հաստատված ռիսկի։
- Խաղացողների բավարարվածությունը միջամտություններով (CSAT փափուկ նոտայից հետո)։
6) Միջամտություններ ՝ ինչ անել
Փափուկ, անգույն (աճող)
1. Տեղեկատվական «ռեալիթի-չեկի» ճիշտ պահին (հաճախականություն, կորուստներ արտասահմանում, դադար 3-5 րոպե)։
2. Առաջարկները տեղադրել/նվազեցնել սահմանները (դեպոզիտներ, կորուստներ, նստաշրջաններ)։
3. «Խտրականությունը գործի մեջ» 'թաքնված ձգձգումներ դեպոզիզացիայի առջև գիշերային ցրումների ժամանակ, պարտադիր դադար։
4. Անձնական խորհուրդներ և ուսուցումներ (եթե խաղացողը համաձայնվի)։
5. Մարդու մոտ էսկալացիա (RG-սպա, աջակցության զրո), իսկ հետո 'ժամանակավոր սահմանափակումներ կամ ինքնազարգացում։
Աստիճանների կանոնը 'որքան բարձր է մոդելային ռիսկը և վստահությունը, այնքան ավելի կոշտ է գործիքների շարքը' միջամտությունից հետո պարտադիր վերագնահատմամբ։
7) Ճարտարապետությունը և MLOps-ը
Սթրիմինգը 'բրոքերի միջոցով իրադարձությունների հավաքումը (օրինակ, Kafka/անալոգներ), պատուհանը 1-5 րոպե ավարտի համար։
Real-time-Time-ը 'վալիդացիայի/սերվի առցանց մոդելը (REST/gRPC), հետաձգման բյուջեն 100-300 մզ։
Ֆիդբեկ-լուպը 'մոդելի գործողությունների լոգը և խաղացողի արդյունքը հակադրվում են։- Ֆիչեստորը ՝ on.ru/35.ru, dreeft (PSI/KS), ավտալերտներ։
- AB պլատֆորմը 'միջամտությունների ռանդոմիզացիա, bandits, CUPED/2019-in-2019։
- Գովերնանսը 'տվյալների կաթոլոգներ, lineage, RBAC, օգտագործված կանոնների աուդիտ։
8) Գաղտնիությունը և կոմպլենսը
PII-ի նվազեցումը, կեղծանունացումը, միայն անհրաժեշտ դաշտերի պահպանումը։- Privacy-by-design-ը 'հասանելիությունը «նվազագույն անհրաժեշտ» սկզբունքով։
- Federated learning-ը և դիֆերենցիալ գաղտնիությունը զգայուն հիվանդությունների համար։
- Տեղական պահանջները 'լոգարանների պահպանումը, թափանցիկ RG քաղաքականությունը, միջամտությունների ամսագիրը, միգրանցների համար որոշումների բացատրությունը։
9) Իրականացման գործընթացը (տուրք)
1. Որոշեք վնասները և նախկին պիտակները 'RG-մասնագետների հետ միասին։
2. Ֆիչեստորը և հոսքը 'N հիմնական ֆիչը, համաձայնեցնել SLAs-ը։
3. Բեյսլին 'լոգրեգ/բուստինգ + տրամաչափություն։
4. Ավելացնել ժամանակը 'հաջորդական մոդելներ/գոյատևումը։
5. Փորձարկել օդաչուն '5-10 տոկոսը, փափուկ միջամտությունները։
6. Չափել uplift harm-reduction-ը և կեղծ գործիքների «արժեքը»։
7. Ընդլայնել 'միջամտությունների կերպարացում, քաուզալ մոդելներ։
8. Վիրահատություն '108, ռետրեյնինգ, դրեյֆ, աուդիտ։
10) Բնորոշ սխալներ և ինչպես խուսափել դրանցից
Մեկ շեմն բոլորի համար։ Անհրաժեշտ է կառուցել հատվածներով և վստահությամբ։- Օպորան միայն վճարների քանակով է։ Կարևոր է հաշվի առնել վարքագծի և համատեքստի արտոնագրերը։
- Գիշերային/բջջային փամփուշտների անտեսումը։ Ժամանակագրությունը պարտադիր է։
- Կալիբրացիայի բացակայությունը։ Ոչ ալիբրացված ռիսկը հանգեցնում է «կոշտ» ռիսկի։
- Ոչ A/B միջամտությունների վերահսկում։ Դժվար է ապացուցել օգուտները։
- «Սև արկղը» առանց բացատրության։ Պահանջվում է բացատրություններ և զեկույցներ։
11) Քեյսներ (ընդհանրացված)
Նստաշրջանների ռիթմին նախազգուշացում. Դետեկտորը բռնում է կարճ նստաշրջանների արագացումը և վերջնական եզրակացությունները առաջարկվում են սահմանը և 10 րոպեանոց դադարը նպաստում են գիշերային համալրումների նվազեցմանը օդաչուի 18-25 տոկոսով։
Uplift-targeting հիշեցումները. Միայն նրանց, ովքեր արձագանքում են «ռեալիթի չեկի», մինուս 12-15 տոկոսն է, որ ինքնաբացարկի հավանականությունը 60-օրյա հորիզոնում։
Մարդու հետ էսկալացիան 'մեքենայի ազդանշանի համադրությունը և RG-սպայի զանգը լավագույն երկարատև էֆեկտը, քան մեքենայի արգելափակումը։
12) Ապակու և գործիքների ընտրությունը (մոտավոր դերեր)
Հումքը և սթրիմինգը 'բրոքերը, CDC-ը BD-ից, օբյեկտի պահեստ։- Ֆիչեստորը և նոութբուքերը 'նշանների կենտրոնացված շերտը, տարբերակումը։
- Մոդելավորում 'բուստինգներ/լոգրեգներ, գրադարաններ հաջորդական մոդելների համար, կաուզային ելույթի շրջանակներ։
- Սերվինգը 'ցածր ուշացում, A/B-և bandits, փորձարկումների թրքինգը։
- Տե՛ ս ՝ dreef fich/target, SLO ուշացման և միջամտությունների մասնաբաժնի համար։
13) Էթիկական սկզբունքները
Թափանցելիությունը 'խաղացողը գիտի RG գործառույթների մրցույթների մասին և կարող է կառավարել դրանք։- Համամասնությունը 'միջոցները համապատասխանում են ռիսկի մակարդակին։
- Անհավասարություն 'նպատակը վնասի նվազումն է, ոչ թե նստաշրջանների աճը ցանկացած գնով։
- Կոնտակտում մարդը 'որոշումների լուծման իրավունքը և օպերատորի օգնությունը։
14) Չեկի թուղթ
- Որոշված են կախվածության պիտակները և RG-KPI-ը։
- Ընտրեք ֆիչին 'հաշվի առնելով մասնավորեցումը, միացված է ֆիշեստորը։
- Բեյսլին Սկորեր, ստուգվում է տրամաչափը։
- Տրամադրված A/B պլատֆորմը և փորձարկման պլանը։
- Ստեղծվել է «միջամտության սանդուղք» և էսկալացիայի սցենարներ։
- Ներառված է 108 դրեյֆը և ռետրեյինգը։
- Մոդելի բացատրությունները և հաճախորդների հաշվետվությունը։
15) Արդյունքը
Windows Science-ը թույլ է տալիս վերածել ցրված իրադարձությունների 'դրույքաչափեր, ավանդներ, դադարներ, գիշերային նստաշրջաններ' ռիսկի ժամանակին և ճշգրիտ ազդանշաններ։ Մտածված միջամտությունների, տրամաբանության և էթիկական կանոնների հետ կապված դա նվազեցնում է վնասը, մեծացնում է վստահությունը և խաղային էկոհամակարգը դարձնում ավելի կայուն 'առանց ավելորդ ճնշման այն խաղացողների վրա, ովքեր ամեն ինչ կարգին է։