Ինչպես Science-ը օգնում է բացահայտել խաղացողների կախվածությունը

1) Ինչո՞ ւ է դա անհրաժեշտ

Խաղային կախվածությունը դրսևորվում է ոչ թե մեկ օրվա ընթացքում, առաջին հերթին ավանդները և նստաշրջանների հաճախությունը աճում են, ապա փոխվում է խաղի ոճը (դոգոն, աճը, գիշերը խաղը), հայտնվում են անտեսված սահմաններ։ Windows Science-ի խնդիրն այն է, որ նկատեք ռիսկի արտոնագրերը ավելի շուտ, քան նրանք հանգեցնում են ֆինանսական և հոգեբանական վնասի, և առաջարկել անձնական միջամտություններ, պահպանելով հավասարակշռությունը բիզնեսի պատասխանատվության և խաղացողի ինքնավարության միջև։

2) Ի՞ նչ տվյալներ ենք օգտագործում (և ինչպե՞ ս պատրաստել դրանք)

Աղբյուրները

Նստաշրջանների լոգները 'մուտքերի հաճախությունը, տևողությունը, ընդմիջումները, օրվա ժամանակը, սարքերը։

Գործարքները 'դեպոզիտներ/եզրակացություններ, վճարման մեթոդներ, վճարումներ, chargeback-stugers։
Խաղային հեռուստատեսություն 'տոկոսադրույքներ, արցունքների անկայունություն, խաղերի տեսակներ, խաղերի միջև անցումներ։
RG ազդանշաններ (Responsible Gaming): Տեղադրումներ/փոփոխություններ սահմաններ, ռելալ-time հիշեցումներ, ինքնախաբեություն։
Աջակցության ծառայություն 'կոչերը, ձգանողները «կորցրեցին վերահսկողությունը», տոնայնությունը (եթե խաղացողը համաձայնվեց վերլուծության համար)։
Համատեքստը 'գեո/ժամ գոտի, սեզոնային, հանգստյան/արձակուրդներ։

Ֆիչին (օրինակներ)

Ավանդների և միջին տոկոսադրույքի աճի արագությունը (գրադիենտներ, էքսպոնենցիալ հարթեցում)։

Նստաշրջանների ռիթմը 'քրոնոպոդոգրաֆիա (feature hashing շաբաթվա ժամերին), գիշերային պիկի։
Patterns dogon-2019-ը 'N-ի կորցնելուց հետո ավելացումը մեկ անգամ անընդմեջ։
Բազմազանության նվազումը (entropy of game choice) 'մեկ կամ երկու ռիսկային խաղերում։
Ֆրիցիա/հոգնածություն 'փոքր ավանդների հաճախության աճը, սարդի անտեսումը, եզրակացությունների վերացումը։
RG-ի ձգողականները 'լիմիտի տեղադրումը մեծ պարտությունից անմիջապես հետո, լիմիտների հաճախակի փոփոխություններից հետո։

Տվյալների որակը

Surrogate յուրահատուկ ID, PII նվազեցումը։

Ֆիչեստորը (feature store) տարբերակով և SLA ուշացումով։
Վալիդացիայի միջոցով 'anomali, dedupliation, սահմաններ (e. g., բացասական դեպոզիտներ)։

3) Ինչպե՞ ս կարելի է նշել «կախվածությունը», եթե կատարյալ պայծառություն չկա։

Proxy-labeling: Ինքնախաբեություն, երկար «Time-uta», աջակցություն հիմնական արտահայտություններին, սահմանների գերագնահատումը ոչ թե իդեալական է, այլ օգտակար։

Թուլացած իրադարձությունները 'հազվագյուտ, այդ իսկ պատճառով հարմար են semi-supervised և PU-learning (positive & unlabeled)։

Ռիսկի փորձագիտական սանդղակը 'կլինիկական հարցաթերթիկները (եթե խաղացողը համաձայնվի), որոնք համախմբված են երկուական/մուլտիկլադային թարգետի մակարդակին։

4) Մոդելներ և մոտեցումներ

Սուպերմարկետի դասական

Գրադիենտ բուստինգը, լոգիստիկ ռեգրեսիա բազային սկորինգի համար (մեկնաբանություն, արագ անցում)։

Հավանականության տրամաբանությունը (Platt/Isotonic) միջամտությունների ճիշտ շեմերի համար։

Հաջորդականությունները և ժամանակը

RNN/Transformer/Temensal CNN-ը նստաշրջանների և նստարանների շարքերի համար։

Սայթաքող պատուհանները, rolling features և attention դեպի «սուր» դրվագներ (գիշերային դոգոն)։
Survival-anensis (Cox, RSF): ժամանակը մինչև անցանկալի իրադարձությունը (ինքնախաբեություն) որպես target։

Առանց ուսուցչի

Վարքագծային դերերի կլաստերիզացիա (k-means, HDBSCAN)։

Անոմալիաների հայտնաբերումը 'Isolation Forest, One-Class SVM, Autoencoder։

Պատճառն ու uplift

Causal-մեթոդները (DID, Causal Forest) և uplift մոդելները, որոնք իսկապես նվազեցնում են ռիսկը կոնկրետ խաղացողի համար։

Մեկնաբանությունը

SHAP/Permutation import.ru + նշանների կայունացումը, RG-թիմի զեկույցները։

5) Որակի և ապրանքի մետրիկները

Մոդելային (off-2019)

AUC-PR (ավելի կարևոր է, քան ROC հազվագյուտ իրադարձությունների ժամանակ), F1/Recall @ Precision, calibration error։

Time-event concordae-ը survival մոդելների համար։

Բիզնեսը և RG-մետրիկները (on-2019)

Time-to-intervention: Որքա՞ ն շուտ է համակարգը միջամտել «վատ» իրադարձություններին։

Խաղացողների մասնաբաժնի նվազումը 30/60/90 օրվա հորիզոնում։

Կորցնելուց հետո ռուսական եզրակացությունների նվազումը, գիշերային նստարանների նվազումը 00: 00-07: 00։

Harm-reduction KPI-ը, որը տեղադրեց լիմիտներ և պահպանեց դրանք։

Cost of false positives: «չզգալ առողջ» - էսկալացիայի մասը առանց հաստատված ռիսկի։
Խաղացողների բավարարվածությունը միջամտություններով (CSAT փափուկ նոտայից հետո)։

6) Միջամտություններ ՝ ինչ անել

Փափուկ, անգույն (աճող)

1. Տեղեկատվական «ռեալիթի-չեկի» ճիշտ պահին (հաճախականություն, կորուստներ արտասահմանում, դադար 3-5 րոպե)։

2. Առաջարկները տեղադրել/նվազեցնել սահմանները (դեպոզիտներ, կորուստներ, նստաշրջաններ)։

3. «Խտրականությունը գործի մեջ» 'թաքնված ձգձգումներ դեպոզիզացիայի առջև գիշերային ցրումների ժամանակ, պարտադիր դադար։

4. Անձնական խորհուրդներ և ուսուցումներ (եթե խաղացողը համաձայնվի)։

5. Մարդու մոտ էսկալացիա (RG-սպա, աջակցության զրո), իսկ հետո 'ժամանակավոր սահմանափակումներ կամ ինքնազարգացում։

Աստիճանների կանոնը 'որքան բարձր է մոդելային ռիսկը և վստահությունը, այնքան ավելի կոշտ է գործիքների շարքը' միջամտությունից հետո պարտադիր վերագնահատմամբ։

7) Ճարտարապետությունը և MLOps-ը

Սթրիմինգը 'բրոքերի միջոցով իրադարձությունների հավաքումը (օրինակ, Kafka/անալոգներ), պատուհանը 1-5 րոպե ավարտի համար։

Real-time-Time-ը 'վալիդացիայի/սերվի առցանց մոդելը (REST/gRPC), հետաձգման բյուջեն 100-300 մզ։

Ֆիդբեկ-լուպը 'մոդելի գործողությունների լոգը և խաղացողի արդյունքը հակադրվում են։

Ֆիչեստորը ՝ on.ru/35.ru, dreeft (PSI/KS), ավտալերտներ։
AB պլատֆորմը 'միջամտությունների ռանդոմիզացիա, bandits, CUPED/2019-in-2019։
Գովերնանսը 'տվյալների կաթոլոգներ, lineage, RBAC, օգտագործված կանոնների աուդիտ։

8) Գաղտնիությունը և կոմպլենսը

PII-ի նվազեցումը, կեղծանունացումը, միայն անհրաժեշտ դաշտերի պահպանումը։

Privacy-by-design-ը 'հասանելիությունը «նվազագույն անհրաժեշտ» սկզբունքով։
Federated learning-ը և դիֆերենցիալ գաղտնիությունը զգայուն հիվանդությունների համար։
Տեղական պահանջները 'լոգարանների պահպանումը, թափանցիկ RG քաղաքականությունը, միջամտությունների ամսագիրը, միգրանցների համար որոշումների բացատրությունը։

9) Իրականացման գործընթացը (տուրք)

1. Որոշեք վնասները և նախկին պիտակները 'RG-մասնագետների հետ միասին։

2. Ֆիչեստորը և հոսքը 'N հիմնական ֆիչը, համաձայնեցնել SLAs-ը։

3. Բեյսլին 'լոգրեգ/բուստինգ + տրամաչափություն։

4. Ավելացնել ժամանակը 'հաջորդական մոդելներ/գոյատևումը։

5. Փորձարկել օդաչուն '5-10 տոկոսը, փափուկ միջամտությունները։

6. Չափել uplift harm-reduction-ը և կեղծ գործիքների «արժեքը»։

7. Ընդլայնել 'միջամտությունների կերպարացում, քաուզալ մոդելներ։

8. Վիրահատություն '108, ռետրեյնինգ, դրեյֆ, աուդիտ։

10) Բնորոշ սխալներ և ինչպես խուսափել դրանցից

Մեկ շեմն բոլորի համար։ Անհրաժեշտ է կառուցել հատվածներով և վստահությամբ։

Օպորան միայն վճարների քանակով է։ Կարևոր է հաշվի առնել վարքագծի և համատեքստի արտոնագրերը։
Գիշերային/բջջային փամփուշտների անտեսումը։ Ժամանակագրությունը պարտադիր է։
Կալիբրացիայի բացակայությունը։ Ոչ ալիբրացված ռիսկը հանգեցնում է «կոշտ» ռիսկի։
Ոչ A/B միջամտությունների վերահսկում։ Դժվար է ապացուցել օգուտները։
«Սև արկղը» առանց բացատրության։ Պահանջվում է բացատրություններ և զեկույցներ։

11) Քեյսներ (ընդհանրացված)

Նստաշրջանների ռիթմին նախազգուշացում. Դետեկտորը բռնում է կարճ նստաշրջանների արագացումը և վերջնական եզրակացությունները առաջարկվում են սահմանը և 10 րոպեանոց դադարը նպաստում են գիշերային համալրումների նվազեցմանը օդաչուի 18-25 տոկոսով։

Uplift-targeting հիշեցումները. Միայն նրանց, ովքեր արձագանքում են «ռեալիթի չեկի», մինուս 12-15 տոկոսն է, որ ինքնաբացարկի հավանականությունը 60-օրյա հորիզոնում։

Մարդու հետ էսկալացիան 'մեքենայի ազդանշանի համադրությունը և RG-սպայի զանգը լավագույն երկարատև էֆեկտը, քան մեքենայի արգելափակումը։

12) Ապակու և գործիքների ընտրությունը (մոտավոր դերեր)

Հումքը և սթրիմինգը 'բրոքերը, CDC-ը BD-ից, օբյեկտի պահեստ։

Ֆիչեստորը և նոութբուքերը 'նշանների կենտրոնացված շերտը, տարբերակումը։
Մոդելավորում 'բուստինգներ/լոգրեգներ, գրադարաններ հաջորդական մոդելների համար, կաուզային ելույթի շրջանակներ։
Սերվինգը 'ցածր ուշացում, A/B-և bandits, փորձարկումների թրքինգը։
Տե՛ ս ՝ dreef fich/target, SLO ուշացման և միջամտությունների մասնաբաժնի համար։

13) Էթիկական սկզբունքները

Թափանցելիությունը 'խաղացողը գիտի RG գործառույթների մրցույթների մասին և կարող է կառավարել դրանք։

Համամասնությունը 'միջոցները համապատասխանում են ռիսկի մակարդակին։
Անհավասարություն 'նպատակը վնասի նվազումն է, ոչ թե նստաշրջանների աճը ցանկացած գնով։
Կոնտակտում մարդը 'որոշումների լուծման իրավունքը և օպերատորի օգնությունը։

14) Չեկի թուղթ

Որոշված են կախվածության պիտակները և RG-KPI-ը։
Ընտրեք ֆիչին 'հաշվի առնելով մասնավորեցումը, միացված է ֆիշեստորը։
Բեյսլին Սկորեր, ստուգվում է տրամաչափը։
Տրամադրված A/B պլատֆորմը և փորձարկման պլանը։
Ստեղծվել է «միջամտության սանդուղք» և էսկալացիայի սցենարներ։
Ներառված է 108 դրեյֆը և ռետրեյինգը։
Մոդելի բացատրությունները և հաճախորդների հաշվետվությունը։

15) Արդյունքը

Windows Science-ը թույլ է տալիս վերածել ցրված իրադարձությունների 'դրույքաչափեր, ավանդներ, դադարներ, գիշերային նստաշրջաններ' ռիսկի ժամանակին և ճշգրիտ ազդանշաններ։ Մտածված միջամտությունների, տրամաբանության և էթիկական կանոնների հետ կապված դա նվազեցնում է վնասը, մեծացնում է վստահությունը և խաղային էկոհամակարգը դարձնում ավելի կայուն 'առանց ավելորդ ճնշման այն խաղացողների վրա, ովքեր ամեն ինչ կարգին է։