Ինչպես AI-ն օգնում է բացահայտել կեղծ հաշիվները
Կեղծ հաշիվները (բոտներ, սիբիլներ, գնված «իրավապահներ», մոխրագույն ֆերմերները) վնասում են վստահությունը, աղավաղում են մետրերը և բարձրացնում ֆրոդի ռիսկերը։ AI-ը թույլ է տալիս հայտնաբերել դրանք վարքագծային, կոնտենտային և ցանցային ազդանշանների համադրությամբ, առանց մասնավոր տվյալների և պահպանել Responsible Gaming-ը։
1) AI ազդանշանները տարբերվում են կեղծիքներից
Վարքագծային (կրկնվող փամփուշտներ)
Գործողությունների աննորմալ հաճախականությունը (մի շարք ռեակցիաներ/հաղորդագրություններ նվազագույն սարդերով)։
«Սառը մեկնարկը» առանց ուռուցքաբանության 'գաղափար չկա, կանոնների ընթերցում չկա, անմիջապես բաց հարցեր։- Ոչ հիփիկ ժամանակավոր գործունեության գոտիները հայտարարված տարածաշրջանի համար, համաժամացումը այլ հաշիվների հետ։
- Զրոյական «սոցիալական իներցիա» 'շատ ելքեր, քիչ պատասխաններ։ կառուցվածքային հաղորդագրությունների պատմության բացակայությունը։
Կոնտենտային
Ձևաչափական արտահայտություններ/բառապաշար, ցածր եզակիություն, նույն տեքստի կրկնօրինակը։- Հղման փամփուշտները 'ցածր հեղինակության օրինակներ, URL ձևանմուշներ, թրքինգի պոչեր։
- Թունավորությունը առանց համատեքստի, հակամարտությունների «խնայելը», վիճահարույց օրակարգի ֆորսինգը։
Ցանցային (գրաֆիկ)
Խիտ «աստղերը» և «օղակները», շատ նոր հաշիվներ միացված են 1-2 հանգույցներին։
Աննորմալ բարձր հարևան հավաքածու (shared neighbors) «տարբեր» կոմպոզիցիաների մոտ։- Նույն ներգրավման երթուղիները 'ով է կտրում մեկին և ինչ կարգով (cascade fingerprinae)։
Տեխնիկական/վիրահատական
Շրջակա միջավայրի աննորմալ տպագրությունները (զննարկիչ/սարահարթ), երբ պահպանվում են գաղտնիությունը և օրենքը։
Հաճախակի կտորներ/ջրային վիճակներ, միևնույն user-agents։- Զրուցում/սոցիալական ցանցերում մասնակցություն միայն/ռիֆերալ ճյուղերում։
"Կարևոր է, որ յուրաքանչյուր ազդանշան ինքնին թույլ է։ Հուսալիությունը տալիս է համադրություն (feature stacking) և գրաֆիկական կոնտեքստը։
2) Տվյալների Delpline առանց մասնավոր ներխուժման
1. Հավաքումը (նվազագույն անհրաժեշտ) 'իրադարձություններ (105, 108, հաղորդագրություններ/արձագանք, լրագրողներ), հանրային պրոֆիլներ, մետատվական հարցումներ (առանց զգայուն բովանդակության պահպանման, որտեղ դա անհրաժեշտ չէ)։
2. Մաքրում 'deduplication, ժամանակի/լեզվի միավորում, սպամա ֆիլտրը։
3. Հարստացումը 'հավաքման միավորներ, ժամանակավոր պատուհաններ (րոպե/ժամ/օր), ցանցային ֆիչեր (աստիճաններ, կլաստերներ)։
4. Վեկտորիզացիա 'տեքստերի/բիո էմբեդինգները (որտեղ թույլատրելի է), կատեգորիկ ֆիչին։
5. Մոդելներ ՝ ֆեյքերի դասակարգիչ, համայնքի գրաֆիկական դետեկտոր, անոմալիայի դետեկտոր։
6. Ակտիվացում ՝ ռիսկերի, ալտերտայի, քեյսերի կանբան, կիսա-ավտոմատիկ գործողություններ (rate-limit/verif/review)։
3) Մոդելային հոսքը (աճող բարդությամբ)
Կանոնները + շեմը (baseline) 'գործողությունների հաճախականությունը, հաշիվի թարմությունը, ինտենսիվությունը, անոմալ ժամանակավոր պատուհանները։
Դասակարգիչ (լոգրեգը/գրադիենտ բուստինգը) 'վարքի, բովանդակության ֆիչեր, պարզ գրաֆիկական նշաններ։- Գրաֆիկական վերլուծություն ՝ Pox Rank/Betweenness, Louvain/Leiden (խիտ համայնքների որոնում), «կամուրջներ» և կասկադներ։
- Աննոմալիա/թայմ շարքը ՝ STL/Prophet, Isolation Forest, One-Class SVM ակտիվություններով։
- Խառը մոտեցումներ 'անսամբլ «դասակարգիչ + գրաֆիկ + անոմալիա» հավանականության տրամաչափով։
Good practice: պահեք մոդելները մեկնաբանվող (SHAP/feature imult.ru), որպեսզի հիմնավորեք որոշումները և նվազեցրեք սխալների ռիսկը։
4) Որակի և սխալների վերահսկումը
Precision @ k/Recall @ k 'ռիսկի վերին հոսքերի ճշգրտությունն ու ամբողջականությունը։- FPR (կեղծ դրական) 'ազնիվ, սխալմամբ նշված կեղծիքների մասնաբաժինը' պահել հնարավորինս ցածր, 4995։
- AUC-PR 'դասերի ուժեղ անհավասարակշռության դեպքում ավելի լավ է, քան AUC-ROC-ը։
- Time-to-mitigate: ժամանակը ձգողից մինչև փափուկ միջոց (rate-limit/revew)։
- Appeals CSAT 'միգրացիայի բավարարումը (արագություն, բացատրության որակը)։
5) Գործի վերաբերյալ որոշումներ ՝ փափուկ միջոցներ, որոնք նպաստում են էսկալացիայի։
Փափուկ (լռելյայն)
Rate-limit-ի վրա։- «Chelenge» -ը պարզ գործողությունների վրա (read-only N րոպե նորերի համար)։
- Հանգիստ հավատացում 'email/հեռագրական կապեր, պարզ գլխարկ։
Միջին
Արտաքին հղումների/լրատվամիջոցների սահմանափակումը մինչև մինի-ուռուցքաբանության անցումը։- Սպորտային պաշտոնների ստվերային մոդերացիան մինչև մոդերատորը ստուգելը։
- Հարցումը կատարվում է (առանց զգայուն տվյալների) ոչ հիփիչային փամփուշտների ժամանակ։
Կոշտ (ստուգումից հետո մարդ)
Ժամանակավոր սառեցում։- Մասնակցության վերացումը պրոմո/վիճակախաղերում։
- Բանը և մրցանակների արձագանքը (եթե պայմանները խախտված են)։
"Միշտ թողեք միգրացիայի ալիքը և բացատրեք, թե ինչու է կիրառվել միջոցը։
6) Ամենօրյա/շաբաթական dashbords
Ամեն օր
«Ռիսկի գնահատման» նոր հաշիվները (low/www.ru/high)։- Գրանցման աճը որոշ աղբյուրներից/թայմ-արցունքներից։
- Ռետվիտների/ռեպոստների ցանցերը բարձր խտությամբ և կրկնությամբ։
- Anomalia-ը հղումներով/ալյումիններով և «այրվող» մոդերացիայով։
Ամեն շաբաթ
FPR/FNR միտումները, բողոքարկումը, վերլուծման ժամանակը։- Կեղծիքների լավագույն կլաստերները և նրանց «կամուրջները» իրական լսարանին։
- ROMI պաշտպանիչ միջոցներ. Քանի՞ սպամ/ֆրոդ կանխված է (գնահատումը)։
- Ռետրոն սխալներով, որտեղ աշխատում էր կեղծ/ուշ, որ մենք փոխում ենք կանոնները։
7) 90-օրյա ճանապարհային քարտեզը
1-30 օրերը Հիմքը
Գաղտնիության քաղաքականությունը/AI/միգրացիաներ; հանրային ֆորումը (որը արգելված է)։- Baseline կանոնները և նվազագույն գլխարկը/chelengi։
- Իրադարձությունների հավաքումը/մաքրումը; առաջնային դաշնամուր (գրանցում, հաճախականություններ, պարզ անոմալիաներ)։
31-60 օրերը 'Մոդելներ և գրաֆիկներ
Ֆեյքերի դասակարգիչը իր օրինակների վրա (մեկնաբանված ֆիչներ)։- Գրաֆիկական կոմպոզիա 'կոմյունիտի դետեկտիվ, «կամուրջներ», ռեպոստների կասկադներ։
- Կես ավտոմատիկ միջոցներ ՝ rate-limit, հղումների սահմանափակում, հանգիստ հավատացում։
- Որակի չափումները + միգրացիայի գործընթացը (SLA 2472 ժամ)։
61-90 օրերը 'Կայունությունը և սխալների նվազումը
Անսամբլը «դասակարգիչ + գրաֆիկ + անոմալիա», շեմերի տրամաբանությունը։- A/B փափուկ միջոցներ (ո՞ ր միջոցները ավելի քիչ են ազդում ազնիվ օգտագործողների վրա)։
- Շաբաթական փոստ-մորտեմներ կեղծ աշխատանքում։ ավարտի նորարարությունը։
- Եռամսյակային զեկույցը ՝ FPR/FNR, Time-to-mitigate, Appeals CSAT, տնտեսական ազդեցություն։
8) Չեկ թերթերը
Anti-feik գործարկումը 2019
- Մոսկվան և միգրացիայի քաղաքականությունը հրապարակվում են։
- Նվազագույն անհրաժեշտ իրադարձությունների հավաքումը և անվտանգ պահպանումը։
- Հիմնական կանոնները + գլխարկ/chelengi ակտիվ են։
- Գրանցման, ակտիվությունների և անոմալիաների Դաշբորդ։
- «human-in-the-loop» գործընթացը վիճահարույց դեպքերի համար։
Մոդելի որակը
- Հետաձգված ընտրություն վալիդացիայի համար։
- Distribution shift-ը և որակը։
- SHAP/feature imult.ru բացատրության համար։
- Շաբաթական ռետրո կեղծ գործեր։
- Արագ մոդերնիզացիայի և նախկին թիմի ալիքը։
9) Հաղորդակցման ձևանմուշները
Ծանուցում փափուկ չափի մասին (կարճ)
Լրացուցիչ ստուգման հարցում
Բողոքարկման պատասխանները
10) Էթիկա, սեփականատիրություն, Responsible Gaming
Տվյալների նվազեցումը 'մի պահեք ավելին։ օգտագործեք ագրեգատներ և անունիզացիա, որտեղ հնարավոր է։- Թափանցիկություն 'գրեք, թե ինչ ազդանշաններ են վերլուծվում և ինչու։ թույլ տվեք հասկանալի բողոքարկման գործընթացը։
- Human-in-the-loop: վերջնական կոշտ միջոցները միայն մոդերատորը ստուգելուց հետո/համադրությամբ։
- RG շրջանակ 'ռիսկի մղում։ գերակայությունը օգտագործողների անվտանգությունն ու բարեկեցությունն է։
- Տեղայնացում 'հաշվի առեք տեղական օրենքները տվյալների և հաղորդակցությունների մասին։
11) Հաճախակի սխալներ և ինչպե՞ ս խուսափել դրանցից
Տեղադրել «կոշտ բանը» մեկ ազդանշանով։ Օգտագործեք անսամբլի և մարդու ապացույց։- Կեղծ դրական անտեսում։ Չափեք FPR-ը, հետևեք բողոքներին և բարելավեք շեմերը։
- Սև արկղը։ Որոշումների բացատրությունը մեծացնում է միգրացիայի վստահությունն ու որակը։
- Փափուկ միջոցների բացակայությունը։ Սկսեք rate-limit/chelengy-ից, մի «պատժեք» անմիջապես։
- Անմոռանալի կանոնները։ Ֆերմերները հարմարվում են. վերանայեք փուչիկները յուրաքանչյուր 2-4 շաբաթվա ընթացքում։
AI-ը կախարդական բոտեր չի բռնում, այն զարգացնում է մոզիկու վարքագծային, կոնտենտային և ցանցային ազդանշաններից, որպեսզի ժամանակին արձագանքեն փափուկ և ազնիվ։ Թափանցիկ քաղաքականությամբ, խմբակցություններով, human-in-the-loop-ով և մոդելների ստացիոնար վերանայմամբ դուք կնվազեցնեք աղմուկը, պաշտպանեք իմպուլսը և պահպանեք ամենակարևորը 'օգտագործողների վստահությունը և համայնքի առողջությունը։