Ինչպես AI-ն օգնում է բացահայտել կեղծ հաշիվները

Կեղծ հաշիվները (բոտներ, սիբիլներ, գնված «իրավապահներ», մոխրագույն ֆերմերները) վնասում են վստահությունը, աղավաղում են մետրերը և բարձրացնում ֆրոդի ռիսկերը։ AI-ը թույլ է տալիս հայտնաբերել դրանք վարքագծային, կոնտենտային և ցանցային ազդանշանների համադրությամբ, առանց մասնավոր տվյալների և պահպանել Responsible Gaming-ը։

1) AI ազդանշանները տարբերվում են կեղծիքներից

Վարքագծային (կրկնվող փամփուշտներ)

Գործողությունների աննորմալ հաճախականությունը (մի շարք ռեակցիաներ/հաղորդագրություններ նվազագույն սարդերով)։

«Սառը մեկնարկը» առանց ուռուցքաբանության 'գաղափար չկա, կանոնների ընթերցում չկա, անմիջապես բաց հարցեր։

Ոչ հիփիկ ժամանակավոր գործունեության գոտիները հայտարարված տարածաշրջանի համար, համաժամացումը այլ հաշիվների հետ։
Զրոյական «սոցիալական իներցիա» 'շատ ելքեր, քիչ պատասխաններ։ կառուցվածքային հաղորդագրությունների պատմության բացակայությունը։

Կոնտենտային

Ձևաչափական արտահայտություններ/բառապաշար, ցածր եզակիություն, նույն տեքստի կրկնօրինակը։

Հղման փամփուշտները 'ցածր հեղինակության օրինակներ, URL ձևանմուշներ, թրքինգի պոչեր։
Թունավորությունը առանց համատեքստի, հակամարտությունների «խնայելը», վիճահարույց օրակարգի ֆորսինգը։

Ցանցային (գրաֆիկ)

Խիտ «աստղերը» և «օղակները», շատ նոր հաշիվներ միացված են 1-2 հանգույցներին։

Աննորմալ բարձր հարևան հավաքածու (shared neighbors) «տարբեր» կոմպոզիցիաների մոտ։

Նույն ներգրավման երթուղիները 'ով է կտրում մեկին և ինչ կարգով (cascade fingerprinae)։

Տեխնիկական/վիրահատական

Շրջակա միջավայրի աննորմալ տպագրությունները (զննարկիչ/սարահարթ), երբ պահպանվում են գաղտնիությունը և օրենքը։

Հաճախակի կտորներ/ջրային վիճակներ, միևնույն user-agents։

Զրուցում/սոցիալական ցանցերում մասնակցություն միայն/ռիֆերալ ճյուղերում։

"Կարևոր է, որ յուրաքանչյուր ազդանշան ինքնին թույլ է։ Հուսալիությունը տալիս է համադրություն (feature stacking) և գրաֆիկական կոնտեքստը։

2) Տվյալների Delpline առանց մասնավոր ներխուժման

1. Հավաքումը (նվազագույն անհրաժեշտ) 'իրադարձություններ (105, 108, հաղորդագրություններ/արձագանք, լրագրողներ), հանրային պրոֆիլներ, մետատվական հարցումներ (առանց զգայուն բովանդակության պահպանման, որտեղ դա անհրաժեշտ չէ)։

2. Մաքրում 'deduplication, ժամանակի/լեզվի միավորում, սպամա ֆիլտրը։

3. Հարստացումը 'հավաքման միավորներ, ժամանակավոր պատուհաններ (րոպե/ժամ/օր), ցանցային ֆիչեր (աստիճաններ, կլաստերներ)։

4. Վեկտորիզացիա 'տեքստերի/բիո էմբեդինգները (որտեղ թույլատրելի է), կատեգորիկ ֆիչին։

5. Մոդելներ ՝ ֆեյքերի դասակարգիչ, համայնքի գրաֆիկական դետեկտոր, անոմալիայի դետեկտոր։

6. Ակտիվացում ՝ ռիսկերի, ալտերտայի, քեյսերի կանբան, կիսա-ավտոմատիկ գործողություններ (rate-limit/verif/review)։

3) Մոդելային հոսքը (աճող բարդությամբ)

Կանոնները + շեմը (baseline) 'գործողությունների հաճախականությունը, հաշիվի թարմությունը, ինտենսիվությունը, անոմալ ժամանակավոր պատուհանները։

Դասակարգիչ (լոգրեգը/գրադիենտ բուստինգը) 'վարքի, բովանդակության ֆիչեր, պարզ գրաֆիկական նշաններ։

Գրաֆիկական վերլուծություն ՝ Pox Rank/Betweenness, Louvain/Leiden (խիտ համայնքների որոնում), «կամուրջներ» և կասկադներ։
Աննոմալիա/թայմ շարքը ՝ STL/Prophet, Isolation Forest, One-Class SVM ակտիվություններով։
Խառը մոտեցումներ 'անսամբլ «դասակարգիչ + գրաֆիկ + անոմալիա» հավանականության տրամաչափով։

Good practice: պահեք մոդելները մեկնաբանվող (SHAP/feature imult.ru), որպեսզի հիմնավորեք որոշումները և նվազեցրեք սխալների ռիսկը։

4) Որակի և սխալների վերահսկումը

Precision @ k/Recall @ k 'ռիսկի վերին հոսքերի ճշգրտությունն ու ամբողջականությունը։

FPR (կեղծ դրական) 'ազնիվ, սխալմամբ նշված կեղծիքների մասնաբաժինը' պահել հնարավորինս ցածր, 4995։
AUC-PR 'դասերի ուժեղ անհավասարակշռության դեպքում ավելի լավ է, քան AUC-ROC-ը։
Time-to-mitigate: ժամանակը ձգողից մինչև փափուկ միջոց (rate-limit/revew)։
Appeals CSAT 'միգրացիայի բավարարումը (արագություն, բացատրության որակը)։

5) Գործի վերաբերյալ որոշումներ ՝ փափուկ միջոցներ, որոնք նպաստում են էսկալացիայի։

Փափուկ (լռելյայն)

Rate-limit-ի վրա։

«Chelenge» -ը պարզ գործողությունների վրա (read-only N րոպե նորերի համար)։
Հանգիստ հավատացում 'email/հեռագրական կապեր, պարզ գլխարկ։

Միջին

Արտաքին հղումների/լրատվամիջոցների սահմանափակումը մինչև մինի-ուռուցքաբանության անցումը։

Սպորտային պաշտոնների ստվերային մոդերացիան մինչև մոդերատորը ստուգելը։
Հարցումը կատարվում է (առանց զգայուն տվյալների) ոչ հիփիչային փամփուշտների ժամանակ։

Կոշտ (ստուգումից հետո մարդ)

Ժամանակավոր սառեցում։

Մասնակցության վերացումը պրոմո/վիճակախաղերում։
Բանը և մրցանակների արձագանքը (եթե պայմանները խախտված են)։

"Միշտ թողեք միգրացիայի ալիքը և բացատրեք, թե ինչու է կիրառվել միջոցը։

6) Ամենօրյա/շաբաթական dashbords

Ամեն օր

«Ռիսկի գնահատման» նոր հաշիվները (low/www.ru/high)։

Գրանցման աճը որոշ աղբյուրներից/թայմ-արցունքներից։
Ռետվիտների/ռեպոստների ցանցերը բարձր խտությամբ և կրկնությամբ։
Anomalia-ը հղումներով/ալյումիններով և «այրվող» մոդերացիայով։

Ամեն շաբաթ

FPR/FNR միտումները, բողոքարկումը, վերլուծման ժամանակը։

Կեղծիքների լավագույն կլաստերները և նրանց «կամուրջները» իրական լսարանին։
ROMI պաշտպանիչ միջոցներ. Քանի՞ սպամ/ֆրոդ կանխված է (գնահատումը)։
Ռետրոն սխալներով, որտեղ աշխատում էր կեղծ/ուշ, որ մենք փոխում ենք կանոնները։

7) 90-օրյա ճանապարհային քարտեզը

1-30 օրերը Հիմքը

Գաղտնիության քաղաքականությունը/AI/միգրացիաներ; հանրային ֆորումը (որը արգելված է)։

Baseline կանոնները և նվազագույն գլխարկը/chelengi։
Իրադարձությունների հավաքումը/մաքրումը; առաջնային դաշնամուր (գրանցում, հաճախականություններ, պարզ անոմալիաներ)։

31-60 օրերը 'Մոդելներ և գրաֆիկներ

Ֆեյքերի դասակարգիչը իր օրինակների վրա (մեկնաբանված ֆիչներ)։

Գրաֆիկական կոմպոզիա 'կոմյունիտի դետեկտիվ, «կամուրջներ», ռեպոստների կասկադներ։
Կես ավտոմատիկ միջոցներ ՝ rate-limit, հղումների սահմանափակում, հանգիստ հավատացում։
Որակի չափումները + միգրացիայի գործընթացը (SLA 2472 ժամ)։

61-90 օրերը 'Կայունությունը և սխալների նվազումը

Անսամբլը «դասակարգիչ + գրաֆիկ + անոմալիա», շեմերի տրամաբանությունը։

A/B փափուկ միջոցներ (ո՞ ր միջոցները ավելի քիչ են ազդում ազնիվ օգտագործողների վրա)։
Շաբաթական փոստ-մորտեմներ կեղծ աշխատանքում։ ավարտի նորարարությունը։
Եռամսյակային զեկույցը ՝ FPR/FNR, Time-to-mitigate, Appeals CSAT, տնտեսական ազդեցություն։

8) Չեկ թերթերը

Anti-feik գործարկումը 2019

Մոսկվան և միգրացիայի քաղաքականությունը հրապարակվում են։
Նվազագույն անհրաժեշտ իրադարձությունների հավաքումը և անվտանգ պահպանումը։
Հիմնական կանոնները + գլխարկ/chelengi ակտիվ են։
Գրանցման, ակտիվությունների և անոմալիաների Դաշբորդ։
«human-in-the-loop» գործընթացը վիճահարույց դեպքերի համար։

Մոդելի որակը

Հետաձգված ընտրություն վալիդացիայի համար։
Distribution shift-ը և որակը։
SHAP/feature imult.ru բացատրության համար։
Շաբաթական ռետրո կեղծ գործեր։
Արագ մոդերնիզացիայի և նախկին թիմի ալիքը։

9) Հաղորդակցման ձևանմուշները

Ծանուցում փափուկ չափի մասին (կարճ)

💡 Բարև։ Մենք սահմանափակեցինք գործողությունների հաճախականությունը հաշիվում, քանի որ գործունեության ոչ պաթոգենների պատճառով։ Սա ժամանակավոր միջոց է համայնքի պաշտպանության համար։ Եթե դուք իրական օգտագործող եք, պարզապես շարունակեք սովորական հաղորդակցությունը, սահմանափակումը ինքնաբերաբար հանվում է։ Օգնության կարիք կա՞։ Գրեք # appeals-ում։

Լրացուցիչ ստուգման հարցում

💡 Մենք նկատեցինք ոչ հիպիկ գործունեություն։ Որպեսզի շարունակեք մասնակցել վիճակագրություններին/հրապարակել հղումները, հաստատեք, խնդրում եմ, (ապահով քայլ)։ Դա կպահանջի 241 րոպե և կօգնի պաշտպանել համայնքը։

Բողոքարկման պատասխանները

💡 Շնորհակալություն դիմելու համար։ Մենք վերանայեցինք և հանեցինք սահմանափակումները/հաստատեցինք միջոցը։ Պատճառը '[հակիրճ]։ Եթե իրավիճակը կրկնվի, թույլ տվեք իմանալ, մենք կօգնենք։

10) Էթիկա, սեփականատիրություն, Responsible Gaming

Տվյալների նվազեցումը 'մի պահեք ավելին։ օգտագործեք ագրեգատներ և անունիզացիա, որտեղ հնարավոր է։

Թափանցիկություն 'գրեք, թե ինչ ազդանշաններ են վերլուծվում և ինչու։ թույլ տվեք հասկանալի բողոքարկման գործընթացը։
Human-in-the-loop: վերջնական կոշտ միջոցները միայն մոդերատորը ստուգելուց հետո/համադրությամբ։
RG շրջանակ 'ռիսկի մղում։ գերակայությունը օգտագործողների անվտանգությունն ու բարեկեցությունն է։
Տեղայնացում 'հաշվի առեք տեղական օրենքները տվյալների և հաղորդակցությունների մասին։

11) Հաճախակի սխալներ և ինչպե՞ ս խուսափել դրանցից

Տեղադրել «կոշտ բանը» մեկ ազդանշանով։ Օգտագործեք անսամբլի և մարդու ապացույց։

Կեղծ դրական անտեսում։ Չափեք FPR-ը, հետևեք բողոքներին և բարելավեք շեմերը։
Սև արկղը։ Որոշումների բացատրությունը մեծացնում է միգրացիայի վստահությունն ու որակը։
Փափուկ միջոցների բացակայությունը։ Սկսեք rate-limit/chelengy-ից, մի «պատժեք» անմիջապես։
Անմոռանալի կանոնները։ Ֆերմերները հարմարվում են. վերանայեք փուչիկները յուրաքանչյուր 2-4 շաբաթվա ընթացքում։

AI-ը կախարդական բոտեր չի բռնում, այն զարգացնում է մոզիկու վարքագծային, կոնտենտային և ցանցային ազդանշաններից, որպեսզի ժամանակին արձագանքեն փափուկ և ազնիվ։ Թափանցիկ քաղաքականությամբ, խմբակցություններով, human-in-the-loop-ով և մոդելների ստացիոնար վերանայմամբ դուք կնվազեցնեք աղմուկը, պաշտպանեք իմպուլսը և պահպանեք ամենակարևորը 'օգտագործողների վստահությունը և համայնքի առողջությունը։