Როგორ აკონტროლებს AI სლოტების რეკომენდაციებს

შესავალი: რეკომენდაციები = მიზანშეწონილობა + ზრუნვა

სლოტის რეკომენდაციების ამოცანაა არჩევანის ხახუნის შემცირება, დაეხმაროს მოთამაშეს სწრაფად მოხვდეს „პირველ გამოცდილებაში“ და არ დაწვას გაუთავებელ ფირზე. ამავე დროს, AI არ ცვლის თამაშების მათემატიკას და არ „იძახის“ RTP: ის ირჩევს შოუს წესრიგს და განმარტავს, თუ რატომ არის ეს ბარათები ახლა შესაფერისი. ნაქსოვი RG-guardrails იცავს გადახურებისგან, ხოლო გამჭვირვალობა ზრდის ნდობას.

1) სიგნალები: რას ხედავს სარეკონსტრუქციო სისტემა

სესიის კონტექსტი: მოწყობილობა, ქსელი, ორიენტაცია, ენა, დროის ლოკალი.

ქცევა: TTFP (პირველი მნიშვნელოვანი მოვლენის დრო), ბილიკის სიღრმე, სესიების ხანგრძლივობა, მოქმედების სიჩქარე/რიტმი.

შინაარსის ისტორია: შესრულებული პროვაიდერები, თემები (ხილი/მითოლოგია/სტიმპანკი), მექანიკა (მეგაისი/კლასტერი), რეაქცია ცვალებადობაზე.

გადახდის კონტექსტი (აგრეგატები): დეპოზიტების/დასკვნების წარმატება, ტიპიური თანხები, სასურველი მეთოდები და მათი ETA.

გამოცდილების ხარისხის სიგნალები: ტიტულების დაბრუნების სიხშირე, შეფერხება, დატვირთვის შეცდომები, პროვაიდერების უკმარისობა.

RG/ეთიკა (აგრეგატები): ღამის მარათონები, დასკვნების გაუქმება - ეს სიგნალები არ იყიდება, მაგრამ გადართეთ ზრუნვის რეჟიმები.

პრინციპები: PII- ის შემცირება, მკაფიო თანხმობა, ადგილობრივი/ფედერალური დამუშავება, ტოკენიზაცია.

2) Fichi: მნიშვნელობა მოვლენების თავზე

თამაშების ემბედინგი: თემები, მექანიკა, სტუდიები, მოვლენების ტემპი - თამაშის ვექტორი.

მოთამაშეთა ემბედინგი: გემოვნება თემებზე/რიტმზე/ცვალებადობაზე, სერიის სიგრძის ტოლერანტობა მოგების გარეშე (ერთეულების მიხედვით).

Co-play და co-view სიგნალები: „თამაშები, რომლებიც ხშირად სხდომების გვერდით არიან“.

Quality fici: სწრაფი დატვირთვის ალბათობა, სტაბილური FPS, მობილური ჟესტების ხელმისაწვდომობა.

სცენარის მარკერები: „ახალბედა“, „დაბრუნება“, „შესვენება“, „გამოსვლის განზრახვა“.

Fairness fici: ტოპ ტიტულების ხელახალი გამოცდის კონტროლი და „გრძელი კუდის“ მხარდაჭერა.

3) მოდელის დასტის რეკომენდაციები

Candidate Generation (ჩანაწერი): lightFM/ANN Embeddings, უახლოესი თამაშები + პოპულარობა სეგმენტში.

Learning-to-Rank (LTR): ბუსტინგი/ნერვული რანკერები მრავალ დანიშნულების ფუნქციით (კლიშე, სწრაფი პირველი გამოცდილება, გადახურვა) და ჯარიმები გადახურებისა/დატვირთვის შეცდომებისთვის.

Sequence მოდელები: Transformer/RNN პროგნოზირებს შემდეგ შესაბამის ნაბიჯს სხდომის ტრაექტორიის გასწვრივ.

Uplift მოდელები: ვისთვისაც პირადი ბლოკი ნამდვილად დაეხმარება (vs კონტროლი) და ვინ უკეთესია, ვიდრე „ფოკუსის რეჟიმი“.

კონტექსტური ბანდიტები: სწრაფი ონლაინ შეკვეთა guard მეტრიკის ფარგლებში.

ალბათობის კალიბრაცია: Platt/Isotonic, ისე, რომ მოდელების ნდობა ემთხვევა რეალობას ახალ ბაზრებზე.

Exploration-policy: greedy/Thompson fairness შეზღუდვებით და სიხშირის ქუდებით.

4) ფანჯრის ორკესტრი: წესები „ბოროტება ./ყვითელი ./წითელი.“

მწვანე: დაბალი რისკი, მაღალი ნდობა, პირადი პოლკი, „სწრაფი დასაწყისი“, თემატური შერჩევა.

ყვითელი: გაურკვევლობა/სუსტი ქსელი - გამარტივებული გზა, მსუბუქი თამაშები, ნაკლები მედია.

წითელი (RG/შესაბამისობა): ჩვენ გამორთეთ გადახურების/გამომუშავების ნიშნები, მათ შორის „მშვიდი რეჟიმი“, ვაჩვენებთ ჰაიდებს ლიმიტებზე და გადახდის სტატუსებზე.

თითოეული სლოტი იღებს score ბარათებს: 'relevance × quality × fairness × RG-mask'.

5) ბარათების შინაარსის სტრატეგია

ერთი ეკრანი არის ოფისის ყველა წესი (თუ არსებობს): კურსი/ვადა/გადაკეთება/ყუთი, „მცირე შრიფტის“ გარეშე.

განმარტება „რატომ არის რეკომენდებული“: „თამაშები მსგავსია X თემაზე/ტემპზე“ ან „სწრაფი დაწყება თქვენს ქსელში“.

ხარისხის ინდიკატორები: „მყისიერი დატვირთვა“, „ერთი ხელის მხარდაჭერა“, „დაბალი ტრაფიკის მოხმარება“.

დივერსიფიკაცია: ნაცნობი და ახალი (სერენდიპიტი), სტუდიების კვოტები/თემა ჯანსაღი ეკოსისტემისთვის.

6) რა არ აკეთებს რეკომენდაციას

ის არ ცვლის RTP/გადახდის ცხრილს და არ პროგნოზირებს შედეგებს.

არ ზეწოლას ახდენს FOMO ტაიმერები და „მუქი ნიმუშები“.

არ აჩვენებს პრომო RG სიგნალებში ან სახსრების გატანის ნაკადში.

არ არის პერსონალიზებული იურიდიულად მნიშვნელოვანი ტექსტი და წესები.

7) კონფიდენციალურობა, კონფიდენციალურობა და შესაბამისობა

თანხმობა ფენებზე: ვიტრინების პერსონალიზაცია და მარკეტინგული გზავნილები.

მონაცემთა მინიმიზაცია და ლოკალიზაცია, მოკლე TTL, ყველაზე დაბალი უფლებების წვდომა.

Fairness მაკონტროლებელი: არ არსებობს სისტემატური დისკრიმინაცია მოწყობილობებზე/ენებზე/რეგიონებში; სტუდიების ექსპოზიციის აუდიტი/თემები.

Policy-as-Code: იურისდიქცია, ასაკი, დასაშვები ფორმულირება და ბონუს ლიმიტები ორკესტრის კოდში.

8) მეტრიკა, რომელსაც აზრი აქვს

UX სიჩქარე: TTFP, „ერთი მოქმედების - ერთი გამოსავალი“ წილი.

შერჩევის ხარისხი: CTR @ k, „ტიტულები“, დეპო-პერ-სესია, დასრულებული „პირველი ექსპერიმენტების“ წილი.

სტაბილურობა: თამაშის დატვირთვის დრო p95, პროვაიდერების error-rate, ავტომობილების გამეორების წილი.

Uplift: შენახვის/დაბრუნების ვადა vs კონტროლი; ჩანართი, რომელიც ნამდვილად დაეხმარა.

RG/ეთიკა: ნებაყოფლობითი ლიმიტები/პაუზები, ღამის გადახურების შემცირება, დასაბუთებული საჩივრების ნულოვანი.

Fairness/ეკოსისტემა: მრავალფეროვანი ექსპოზიცია (Gini/Entropy), „გრძელი კუდი“ საუკეთესო ფანჯარაში.

9) რეფერენდუმი-არქიტექტურა

Event Bus, Feature Store (online/offline), Candidate Gen (ANN/embedings), Ranker (LTR/seq/uplift + calibratilibration), PoGEnGEnGGGing (ze ./Ging ./Ganing., fe), fe., Fing შესაბამისობა) - UI Runtime (პოლკები/ბარათები/ახსნა) - XAI & Audit - Experimentation (A/B/bandites/geo-lift), Analytics (KPI/RG/FAAiRD/FAiRiRiRiRiREAAPPEAAd)

პარალელურად: შინაარსის კატალოგი (თამაშების მეტამონაცემები), Quality Service (დატვირთვა/შეცდომები), პირადი Hub (თანხმობა/TTL), დიზაინის სისტემა (A11y ნიშნები).

10) ოპერაციული სცენარები

სუსტი ქსელის ახალი მომხმარებელი: მსუბუქი თამაშების ჩანაწერი, LTR აძლევს „სწრაფ დაწყებას“, ახსნა „თქვენი ქსელის ქვეშ“, მედია შემცირებულია.

პაუზის შემდეგ დაბრუნება: პოლკი „დაუბრუნდეს ახალ თემებს, რომლებიც მოსწონთ“ + 1-2, ბანდიტი გადაწყვეტს წესრიგს.

განზრახული „დასკვნა“: პრომო იმალება; ნაჩვენებია გადახდის ოსტატი, სტატუსები „მყისიერად/შემოწმება/სახელმძღვანელო გადამოწმება“, ჰაიდი „როგორ უნდა დააჩქაროთ“.

პროვაიდერის უკმარისობა: quality-score ეცემა, ორკესტრი ცვლის ტაიტებს და აღნიშნავს მიზეზს XAI მინიშნებაში.

11) A/B და „ფრთხილად“ ბანდიტები

Guard მეტრიკა: შეცდომები/საჩივრები/RG სიგნალები - დეგრადაციის დროს, ავტომატური გამოტოვება.

A/A და ჩრდილის გამოსხივება: სტაბილურობის შემოწმება ჩართვამდე.

Uplift ექსპერიმენტები: ჩვენ ვზომავთ შეთქმულებას და არა მხოლოდ CTR.

ინტერვენციის კაპინგი: სხდომის ადაპტაცია N, გასაგებია „ნაგულისხმევი დაბრუნება“.

12) MLOps/ოპერაცია

Datasets/fich/მოდელები/რეიდები; სრული ხაზები და რეპროდუქცია.

გემოვნების/არხების/მოწყობილობების დრიფტის მონიტორინგი; მანქანის კალიბრი.

სწრაფი rollback წინა დროშები; ქვიშის ყუთები რეგულატორისა და შიდა აუდიტისთვის.

ტესტების ნაკრები: სპექტაკლი (LCP/INP), A11y (კონტრასტი/ფოკუსი), შესაბამისობა (აკრძალული ფორმულირება).

13) საგზაო განხორციელების რუკა (8-12 კვირა) MVP; 4-6 თვე (სიმწიფე)

კვირები 1-2: ღონისძიების ლექსიკონი, თამაშების კატალოგი, თანხმობა/Privacy Hub, ძირითადი ჩანაწერები.

არგუმენტები 3-4: LTR v1 quality ფაქტორებით, „სწრაფი დაწყების“ რეჟიმი, XAI ახსნა.

კვირები 5-6: ტრაექტორიის სეკის მოდელები, ბანდიტები, fairness კვოტები, პოლიცია-as-code.

კვირები 7-8: uplift მოდელები, RG-guardrails, პერფის ოპტიმიზაცია, ჩრდილის გამოსხივება.

თვეები 3-6: ფედერალური დამუშავება, მანქანის კალიბრი, ბაზრის მასშტაბები, მარეგულირებელი ქვიშის ყუთები.

14) ხშირი შეცდომები და როგორ მოვერიდოთ მათ

მხოლოდ CTR ოპტიმიზაცია. მრავალრიცხოვანი რანგერი + uplift/TTFP.

შეპყრობილი პრომო. კაპინგი და „მშვიდი რეჟიმი“ RG სიგნალებზე.

დატვირთვის ხარისხის უგულებელყოფა. რანგში quality-score სავალდებულოა.

არ არის გასაგები. აჩვენეთ „რატომ არის რეკომენდებული“ და პერსონალიზაციის გამორთვის მარტივი გზები.

მყიფე გამოშვებები. Fich Flages, A/A, სწრაფი გამოტოვება - წინააღმდეგ შემთხვევაში, ჩვენ „ვჭრით“ ძაბრს.

Slots AI რეკომენდაციები არის მიზანშეწონილობის სისტემა: სუფთა სიგნალები, კალიბრირებული მოდელები, ზრუნვის წესები და გამჭვირვალე ახსნა. ასეთი წრე აჩქარებს პირველ გამოცდილებას, იზრუნებს ყურადღებას, მხარს უჭერს შინაარსის ეკოსისტემას და ზრდის ნდობას. ფორმულა: მონაცემები rank/seq/uplift-policy ძრავა, რომელიც აიხსნება UI. შემდეგ ფირზე იგრძნობა „თქვენი“, ხოლო პროდუქტი - გულწრფელი და სწრაფი.