Jak AI personalizuje misje i wyzwania turniejowe
1) Dlaczego spersonalizować
AI-personalizacja misji i zadań turniejowych:- zwiększa znaczenie (misje „w dobrej formie”, bez nudnej szlifowania);
- zmniejsza frustrację (trudności i czas trwania profilu gracza);
- poprawia zachowanie i zaangażowanie (widoczny postęp, zrozumiałe cele);
- chroni gospodarkę (kontrolowana emisja nagród i uczciwość warunków).
Klucz: równowaga personalizacji i uczciwości - indywidualne cele nie powinny dawać matematycznej przewagi w grach.
2) Sygnały danych (wejścia modelowe)
Zachowanie: gatunki/dostawcy gniazd, średnia szybkość, tempo spinu, długość sesji, godzina dnia, częstotliwość wejścia.
Postęp: poziomy/XP, zakończenie poprzednich misji, sukces/porażka w turniejach, smuga'i.
Środki finansowe: depozyty/wypłaty (zagregowane, brak danych wrażliwych), wrażliwość na premie.
Społeczność: udział w czatach/wydarzeniach, klipy/repliki, reakcje społeczności (jeśli występują).
Kontekst: urządzenie, kanał wejściowy, ograniczenia geograficzne treści/dostawców.
Sygnały RG: limity czasu/depozytu, tendencja do długich sesji - w celu zmniejszenia złożoności i miękkich przerw.
3) Model stosu
1. Klastrowanie (bez nadzoru)
K-Means/DBSCAN/HDBSCAN → segmenty behawioralne: „sprinter”, „collector”, „turniej starter”, „brand-lay to providers”.
Użycie: wybierz podstawową „ramkę” misji dla segmentu.
2. Punktacja skłonności (nadzorowana)
Cel: Prawdopodobieństwo zakończenia misji X w oknie T, prawdopodobieństwo uczestnictwa/ukończenia turnieju.
Modele: Gradient Boosting (GBDT), regresja logistyczna, transformatory tabelaryczne.
3. Bandyci kontekstowi
Cel: wybór online typu misji i złożoności w kontekście kontroli poszukiwań/eksploatacji.
Metody: Pobieranie próbek LinUCB/Thompson.
4. RL/Uczenie się polityki (nieobowiązkowo)
Cel: Optymalizacja sekwencji misji/zadań (łańcuchów), aby przytrzymać gracza bez przegrzania.
Ograniczenia: ścisłe ograniczenia bezpieczeństwa (zob. § 7).
4) Dane rurociągowe i rozwiązanie w sprzedaży
Kolekcja wydarzeń: autobus (Kafka/Redpanda), schematy: spin, session_start/end, mission_progress, tournament_result.
Szczelinowanie: ramki 1h/24h/7d; agregaty (mediana stopy procentowej, wahania tempa, różnorodność dostawców).
Modele montażu/aktualizacji: offline raz na 1-7 dni; punktacja online na każdej sesji + częściowy dodatkowy trening bandyty.
Ograniczenia emisji: polityka uczciwości (limity stawek, pułapy przyznawania, ograniczenia RG).
Logowanie decyzji: kto/kiedy/która opcja polityki jest pokazana, szansa, oczekiwana złożoność, rzeczywisty wynik.
5) Generator misji (logika decyzji)
1. Segment: klaster → podstawowy koszyk misyjny (gatunki, czas trwania).
2. Filtry zgodności: dostawcy, geo, ograniczenia RG (w tym dzienne terminy).
3. Ocena skłonności: klasyfikacja kandydatów według prawdopodobieństwa ukończenia i oczekiwanej wartości (XT Retensna).
4. Kontekstowy bandyta: wybór 1-2 najlepszych kandydatów z e- exploration.
5. Trudności w dostrajaniu: dostosowanie celów (liczba obrotów/zakład/czas) do okna obwodowego (np. weekend/weekend).
6. Pułap emisji: sezonowa kontrola budżetu tokenu/kosmetyków.
7. Znacząca alternatywa: zaoferować 1 misję zapasową („zmień” przycisk raz na X godziny).
6) Personalizacja zadań turniejowych
Wybór ligi/podziału według MMR i historii jest niezależny od VIP (patrz poprzedni artykuł).
Indywidualne mikroprzedsiębiorstwa w ramach turnieju: „grać 3 dostawców”, „zachować tempo ≤ N spiny/min”, „odznaka dla górnej X%” - skręcić na skłonności.
Elastyczne okna uczestnictwa: sloty czasowe, gdy gracz jest częściej online; AI zaleca sesję przesiewową.
Nagradzanie utworów według profilu: kosmetyki i żetony z uwzględnieniem rzadkości, ale bez zwiększania RTP/właściwości.
7) Zasady integralności, obowiązki i ograniczenia dotyczące sztucznej inteligencji
Ograniczenia bezpieczeństwa: maksymalnie N osobiste misje dziennie; zakaz zwiększania złożoności sygnałów zmęczenia RG.
Przejrzystość: „Jak wybierane są misje” ekran: segmenty, kontekst, ochrona przed awariami (zegary litości), czapki nagród.
Sprawiedliwość: ten sam pułap nagród dla każdego; personalizacja zmienia ścieżkę, a nie wynikającą z niej wartość.
Odpowiedzialna gra: miękkie pauzy, zalecenia „odpoczynku”, dzienne limity - wbudowane w politykę.
Prywatność: tylko agregaty; brak PII w cechach modelu wykraczających poza minimum regulacyjne.
8) Przeciwdziałanie nadużyciom i zwalczanie gier
Wykrywanie jednolitych cykli: powtórzenia z wysoką częstotliwością misji → wymagają zmienności (dostawca/zakład/czas).
Czapka tempa: nie więcej niż X misje/dzień, cofnięcie między „szybkimi” zadaniami.
Osłony trudności: dolne/górne granice; ostre skoki są zabronione.
Zmowy turniejowe: Podpisy sieciowe/behawioralne, Losowe kontrole KYC w mistrzowskich ligach.
Kontrola dziennika: możliwość wyjaśnienia decyzji (kody powodów: segment, skłonności, bandyta-ramię).
9) Wskaźniki sukcesu
Podniesienie D7/D30 w spersonalizowanych kontra podstawowe.
Wskaźnik zakończenia misji i mediana czasu do końca (TTC).
Lepkość (DAU/MAU), długość sesji Avg (z osłoną RG).
Rozkład gini nagród (równość przy podobnych wysiłkach).
Wskaźnik reklamacji przez „niesprawiedliwość” i Mute/Opt-out Rate personalizacji.
Nagroda ROI/Emissions to GGR - Sustainability of the Promotional Economy.
Koszt eksploracji bandyta i żal - aby skonfigurować oprogramowanie do pobierania próbek.
10) Wzory A/B do uruchomienia
1. Typy misji: specyficzny dla dostawcy gatunek.
2. Długość misji: krótka (≤ 15 min) vs medium (30-40 min).
3. Zegary litości: twarde vs miękkie w tym samym p₀.
4. Algorytm bandytów: LinUCB vs Thompson; Inna, w tym inna.
5. Zmiana misji: dostęp 1/dzień vs 2/dzień.
6. Mikro-gole turnieju: jeden vs dwa równoległe.
11) Misje i zadania turniejowe szablonów (JSON)
Misja (spersonalizowana):json
{
„mission_id": „m. s3. var. czas zabawy. zróżnicowane. 001”, „tytuł”: „Otwórz trzy światy”, „segment_hint": „kolekcjoner”, „trudność”: „medium”, „wymagania”: [
{„type „: „provider _ diversity „, „providers”: 3,” window _ min”: 30}, {„type „: „bet _ range”,” min”: 0. 2, „max”: 1. 0}
], „litość”: {„soft _ delta”: 0. 02, „cap”: 0. 4, "hard _ after _ attempts": 30}, "rewards": {"tokens": 12, "cosmetic_drop": {"rarity ": "Rare"," p": 0. 12}}, „caps': {” daily _ user _ missions „: 3,” economy_token_cap": 150}
}
Mikro-cel turnieju:
json
{
„task_id": „t. s3. kwalifikator. pacing. tempo "," kontekst ": {" league ":" Gold "," time _ slot ":" evening "}," goal ": {" type ":" pace _ control "," max _ spins _ per _ min ": 45," duration _ min ": 20}," vip_neutral": true "," rewards ": {" season _ points ": 120}," uczciwość ": {" max _ value _ equivalence ": true}
}
12) Pseudokoda produkcyjna (bandyta kontekstowy)
kontekst pythona: segment, czas, urządzenie, ostatnie TTC, kontekst flag RG = build_context (user_id)
kandydatów = fetch_candidate_missions (segment = kontekst. segment)
kandydaci = compliance_filter (kandydaci, kontekst. Geo, kontekst. rg)
punktowany = [(m, propensity_score (m, kontekst)) dla m w kandydatach]
topk = top_by_score (punktowany, k = 5)
bandyta wybiera „rękę” (ramię)
wybrany = contextual_bandit. choose_arm (topK, kontekst)
dopasujmy złożoność + sprawdź spersonalizowany budżet emisji = adjust_difficulty (wybrany, kontekst)
jeśli nie economy_budget_ok (spersonalizowane):
personalizowane = degrade_reward (spersonalizowane)
log_decision (user_id, kontekst, spersonalizowane)
dostarczenie (spersonalizowane)
13) Wzory UX
Przezroczystość: „Dopasowany do Twojego stylu: 30-40 min, 3 dostawców, zwycięstwo - rzadka kropla kosmetyczna”.
Sterowanie: przycisk „Change mission” (cooldown), przełącznik przełącznika „disable personalization”.
Gładkość: wskaźniki trudności, ocena czasu, pasek postępu z prognozą TTC.
Cichy VFX: Krótkie animacje sukcesu; sprzężenie zwrotne do niepowodzenia - + fragmenty/postęp litości.
14) Plan uwolnienia
1. MVP (3-5 tygodni): zgrupowanie + skłonności do wykonywania misji; problemy z turniejem statycznym; ograniczenia emisji; ekran przejrzystości.
2. v0. 9: kontekstowy bandyta; zmiana misji; mikroprzedsiębiorstwa w turniejach; Pełni strażnicy RG.
3. v1. 0: łańcuchy misji RL; cele społeczne; kolekcje wizualne; raporty „szczerości” i audyty dzienników.
4. Następny: sezonowa rotacja szablonu, retro kosmetyki powroty, cross-promocje z dostawcami.
15) Lista kontrolna przed startem
- Personalizacja nie wpływa na zaletę RTP/matematyki.
- Ograniczenia emisji i dzienne limity misji.
- Ustawiono zegary litości i kamienie milowe deterministyczne.
- Jak to działa ekran + kody powody.
- Zasady RG: pauzy, limity, opcja „wyłączyć personalizację”.
- Przeciwdziałanie nadużyciom: zmienność wymogów, pułap tempa, kontrola dzienna decyzji.
- Plan A/B oraz wykaz docelowych KPI z progami sukcesu.
Personalizacja AI nie jest „trudniejsza”, ale mądrzejsza: misje i zadania turniejowe dostosowują się do stylu gracza, ale pozostają uczciwe i bezpieczne, emisje są w budżecie, a zasady są przejrzyste. Klaster + skłonności stanowią podstawę, bandyci kontekstowi optymalizują wyświetlacz, RL poprawia łańcuchy - a wszystko to działa tylko z wyraźnymi ograniczeniami, strażami RG i zrozumiałą komunikacją „jak dokładnie wybieramy cele”.