Jak AI personalizuje misje i wyzwania turniejowe

1) Dlaczego spersonalizować

AI-personalizacja misji i zadań turniejowych:

zwiększa znaczenie (misje „w dobrej formie”, bez nudnej szlifowania);
zmniejsza frustrację (trudności i czas trwania profilu gracza);
poprawia zachowanie i zaangażowanie (widoczny postęp, zrozumiałe cele);
chroni gospodarkę (kontrolowana emisja nagród i uczciwość warunków).

Klucz: równowaga personalizacji i uczciwości - indywidualne cele nie powinny dawać matematycznej przewagi w grach.

2) Sygnały danych (wejścia modelowe)

Zachowanie: gatunki/dostawcy gniazd, średnia szybkość, tempo spinu, długość sesji, godzina dnia, częstotliwość wejścia.

Postęp: poziomy/XP, zakończenie poprzednich misji, sukces/porażka w turniejach, smuga'i.

Środki finansowe: depozyty/wypłaty (zagregowane, brak danych wrażliwych), wrażliwość na premie.

Społeczność: udział w czatach/wydarzeniach, klipy/repliki, reakcje społeczności (jeśli występują).

Kontekst: urządzenie, kanał wejściowy, ograniczenia geograficzne treści/dostawców.

Sygnały RG: limity czasu/depozytu, tendencja do długich sesji - w celu zmniejszenia złożoności i miękkich przerw.

💡 Ważne: wszystkie modele pracują z zagregowanymi, anonimizowanymi funkcjami, bez używania PII poza tym, co jest wymagane przez zgodność.

3) Model stosu

1. Klastrowanie (bez nadzoru)

K-Means/DBSCAN/HDBSCAN → segmenty behawioralne: „sprinter”, „collector”, „turniej starter”, „brand-lay to providers”.

Użycie: wybierz podstawową „ramkę” misji dla segmentu.

2. Punktacja skłonności (nadzorowana)

Cel: Prawdopodobieństwo zakończenia misji X w oknie T, prawdopodobieństwo uczestnictwa/ukończenia turnieju.

Modele: Gradient Boosting (GBDT), regresja logistyczna, transformatory tabelaryczne.

3. Bandyci kontekstowi

Cel: wybór online typu misji i złożoności w kontekście kontroli poszukiwań/eksploatacji.

Metody: Pobieranie próbek LinUCB/Thompson.

4. RL/Uczenie się polityki (nieobowiązkowo)

Cel: Optymalizacja sekwencji misji/zadań (łańcuchów), aby przytrzymać gracza bez przegrzania.

Ograniczenia: ścisłe ograniczenia bezpieczeństwa (zob. § 7).

4) Dane rurociągowe i rozwiązanie w sprzedaży

Kolekcja wydarzeń: autobus (Kafka/Redpanda), schematy: spin, session_start/end, mission_progress, tournament_result.

Szczelinowanie: ramki 1h/24h/7d; agregaty (mediana stopy procentowej, wahania tempa, różnorodność dostawców).

Modele montażu/aktualizacji: offline raz na 1-7 dni; punktacja online na każdej sesji + częściowy dodatkowy trening bandyty.

Ograniczenia emisji: polityka uczciwości (limity stawek, pułapy przyznawania, ograniczenia RG).

Logowanie decyzji: kto/kiedy/która opcja polityki jest pokazana, szansa, oczekiwana złożoność, rzeczywisty wynik.

5) Generator misji (logika decyzji)

1. Segment: klaster → podstawowy koszyk misyjny (gatunki, czas trwania).

2. Filtry zgodności: dostawcy, geo, ograniczenia RG (w tym dzienne terminy).

3. Ocena skłonności: klasyfikacja kandydatów według prawdopodobieństwa ukończenia i oczekiwanej wartości (XT Retensna).

4. Kontekstowy bandyta: wybór 1-2 najlepszych kandydatów z e- exploration.

5. Trudności w dostrajaniu: dostosowanie celów (liczba obrotów/zakład/czas) do okna obwodowego (np. weekend/weekend).

6. Pułap emisji: sezonowa kontrola budżetu tokenu/kosmetyków.

7. Znacząca alternatywa: zaoferować 1 misję zapasową („zmień” przycisk raz na X godziny).

6) Personalizacja zadań turniejowych

Wybór ligi/podziału według MMR i historii jest niezależny od VIP (patrz poprzedni artykuł).

Indywidualne mikroprzedsiębiorstwa w ramach turnieju: „grać 3 dostawców”, „zachować tempo ≤ N spiny/min”, „odznaka dla górnej X%” - skręcić na skłonności.

Elastyczne okna uczestnictwa: sloty czasowe, gdy gracz jest częściej online; AI zaleca sesję przesiewową.

Nagradzanie utworów według profilu: kosmetyki i żetony z uwzględnieniem rzadkości, ale bez zwiększania RTP/właściwości.

7) Zasady integralności, obowiązki i ograniczenia dotyczące sztucznej inteligencji

Ograniczenia bezpieczeństwa: maksymalnie N osobiste misje dziennie; zakaz zwiększania złożoności sygnałów zmęczenia RG.

Przejrzystość: „Jak wybierane są misje” ekran: segmenty, kontekst, ochrona przed awariami (zegary litości), czapki nagród.

Sprawiedliwość: ten sam pułap nagród dla każdego; personalizacja zmienia ścieżkę, a nie wynikającą z niej wartość.

Odpowiedzialna gra: miękkie pauzy, zalecenia „odpoczynku”, dzienne limity - wbudowane w politykę.

Prywatność: tylko agregaty; brak PII w cechach modelu wykraczających poza minimum regulacyjne.

8) Przeciwdziałanie nadużyciom i zwalczanie gier

Wykrywanie jednolitych cykli: powtórzenia z wysoką częstotliwością misji → wymagają zmienności (dostawca/zakład/czas).

Czapka tempa: nie więcej niż X misje/dzień, cofnięcie między „szybkimi” zadaniami.

Osłony trudności: dolne/górne granice; ostre skoki są zabronione.

Zmowy turniejowe: Podpisy sieciowe/behawioralne, Losowe kontrole KYC w mistrzowskich ligach.

Kontrola dziennika: możliwość wyjaśnienia decyzji (kody powodów: segment, skłonności, bandyta-ramię).

9) Wskaźniki sukcesu

Podniesienie D7/D30 w spersonalizowanych kontra podstawowe.

Wskaźnik zakończenia misji i mediana czasu do końca (TTC).

Lepkość (DAU/MAU), długość sesji Avg (z osłoną RG).

Rozkład gini nagród (równość przy podobnych wysiłkach).

Wskaźnik reklamacji przez „niesprawiedliwość” i Mute/Opt-out Rate personalizacji.

Nagroda ROI/Emissions to GGR - Sustainability of the Promotional Economy.

Koszt eksploracji bandyta i żal - aby skonfigurować oprogramowanie do pobierania próbek.

10) Wzory A/B do uruchomienia

1. Typy misji: specyficzny dla dostawcy gatunek.

2. Długość misji: krótka (≤ 15 min) vs medium (30-40 min).

3. Zegary litości: twarde vs miękkie w tym samym p₀.

4. Algorytm bandytów: LinUCB vs Thompson; Inna, w tym inna.

5. Zmiana misji: dostęp 1/dzień vs 2/dzień.

6. Mikro-gole turnieju: jeden vs dwa równoległe.

11) Misje i zadania turniejowe szablonów (JSON)

Misja (spersonalizowana):

json
{
„mission_id": „m. s3. var. czas zabawy. zróżnicowane. 001”, „tytuł”: „Otwórz trzy światy”, „segment_hint": „kolekcjoner”, „trudność”: „medium”, „wymagania”: [
{„type „: „provider _ diversity „, „providers”: 3,” window _ min”: 30}, {„type „: „bet _ range”,” min”: 0. 2, „max”: 1. 0}
], „litość”: {„soft _ delta”: 0. 02, „cap”: 0. 4, "hard _ after _ attempts": 30}, "rewards": {"tokens": 12, "cosmetic_drop": {"rarity ": "Rare"," p": 0. 12}}, „caps': {” daily _ user _ missions „: 3,” economy_token_cap": 150}
}

Mikro-cel turnieju:

json
{
„task_id": „t. s3. kwalifikator. pacing. tempo "," kontekst ": {" league ":" Gold "," time _ slot ":" evening "}," goal ": {" type ":" pace _ control "," max _ spins _ per _ min ": 45," duration _ min ": 20}," vip_neutral": true "," rewards ": {" season _ points ": 120}," uczciwość ": {" max _ value _ equivalence ": true}
}

12) Pseudokoda produkcyjna (bandyta kontekstowy)

kontekst pythona: segment, czas, urządzenie, ostatnie TTC, kontekst flag RG = build_context (user_id)

kandydatów = fetch_candidate_missions (segment = kontekst. segment)
kandydaci = compliance_filter (kandydaci, kontekst. Geo, kontekst. rg)

punktowany = [(m, propensity_score (m, kontekst)) dla m w kandydatach]
topk = top_by_score (punktowany, k = 5)

bandyta wybiera „rękę” (ramię)
wybrany = contextual_bandit. choose_arm (topK, kontekst)

dopasujmy złożoność + sprawdź spersonalizowany budżet emisji = adjust_difficulty (wybrany, kontekst)
jeśli nie economy_budget_ok (spersonalizowane):
personalizowane = degrade_reward (spersonalizowane)

log_decision (user_id, kontekst, spersonalizowane)
dostarczenie (spersonalizowane)

13) Wzory UX

Przezroczystość: „Dopasowany do Twojego stylu: 30-40 min, 3 dostawców, zwycięstwo - rzadka kropla kosmetyczna”.

Sterowanie: przycisk „Change mission” (cooldown), przełącznik przełącznika „disable personalization”.

Gładkość: wskaźniki trudności, ocena czasu, pasek postępu z prognozą TTC.

Cichy VFX: Krótkie animacje sukcesu; sprzężenie zwrotne do niepowodzenia - + fragmenty/postęp litości.

14) Plan uwolnienia

1. MVP (3-5 tygodni): zgrupowanie + skłonności do wykonywania misji; problemy z turniejem statycznym; ograniczenia emisji; ekran przejrzystości.

2. v0. 9: kontekstowy bandyta; zmiana misji; mikroprzedsiębiorstwa w turniejach; Pełni strażnicy RG.

3. v1. 0: łańcuchy misji RL; cele społeczne; kolekcje wizualne; raporty „szczerości” i audyty dzienników.

4. Następny: sezonowa rotacja szablonu, retro kosmetyki powroty, cross-promocje z dostawcami.

15) Lista kontrolna przed startem

Personalizacja nie wpływa na zaletę RTP/matematyki.
Ograniczenia emisji i dzienne limity misji.
Ustawiono zegary litości i kamienie milowe deterministyczne.
Jak to działa ekran + kody powody.
Zasady RG: pauzy, limity, opcja „wyłączyć personalizację”.
Przeciwdziałanie nadużyciom: zmienność wymogów, pułap tempa, kontrola dzienna decyzji.
Plan A/B oraz wykaz docelowych KPI z progami sukcesu.

Personalizacja AI nie jest „trudniejsza”, ale mądrzejsza: misje i zadania turniejowe dostosowują się do stylu gracza, ale pozostają uczciwe i bezpieczne, emisje są w budżecie, a zasady są przejrzyste. Klaster + skłonności stanowią podstawę, bandyci kontekstowi optymalizują wyświetlacz, RL poprawia łańcuchy - a wszystko to działa tylko z wyraźnymi ograniczeniami, strażami RG i zrozumiałą komunikacją „jak dokładnie wybieramy cele”.