ミッションとトーナメントの課題をAIがパーソナライズする方法
1)パーソナライズする理由
ミッションとトーナメントタスクのAIパーソナライズ:- 関連性を高めます(ミッション「良い形で」、退屈な粉砕せずに)。
- フラストレーション(プレイヤーのプロフィールの難しさと期間)を軽減します。
- 保持とエンゲージメントを向上させます(目に見える進歩、理解可能な目標)。
- 経済を保護します(条件の管理された賞の発行と正直さ)。
カギ:パーソナライゼーションと公平性のバランス-個々の目標はゲームで数学的な優位性を与えるべきではありません。
2)データ信号(モデル入力)
行動:スロットジャンル/プロバイダー、平均レート、スピンペース、セッションの長さ、一日の時間、入場頻度。
進行状況:レベル/XP、過去のミッションの完了、トーナメントでの成功/失敗、ストリーク"と。
財務:預金/出金(集計、機密情報なし)、ボーナスへの感度。
ソーシャル:チャット/イベントへの参加、クリップ/リプレイ、コミュニティの反応(もしあれば)。
コンテキスト:デバイス、入力チャネル、コンテンツ/プロバイダの地理的制限。
RG信号:時間/預金限界、長いセッションへの傾向-複雑さとソフトな一時停止を減らすために。
3)モデルスタック
1.クラスタリング(監視対象外)
K-Means/DBSCAN/HDBSCAN→行動セグメント:「sprinter」、 「collector」、 「tournament starter」、 「brand-lay to providers」。
使用法:セグメントのミッションの基本的な「フレーム」を選択します。
2.プロペンシブスコアリング(監督)
目標:TウィンドウでXミッションを完了する確率、トーナメントに参加/終了する確率。
モデル:グラデーションブースト(GBDT)、ロジスティック回帰、表形式トランス。
3.コンテキストバンディット
目的:探査/搾取制御とコンテキストの下でミッションタイプと複雑さのオンライン選択。
メソッド:LinUCB/Thompson Sampling。
4.RL/ポリシー学習(オプション)
目標:ミッション/タスクシーケンス(チェーン)を最適化し、過熱することなくプレイヤーを保持します。
制限:厳格な安全規制(第7条を参照)。
4)販売のパイプラインデータそして解決
イベントのコレクション:イベントバス(カフカ/レッドパンダ)、スキーム:スピン、session_start/end、 mission_progress、 tournament_result。
Fichering: 1h/24h/7dフレーム;集計(中央値、ペース分散、プロバイダの多様性)。
適合/更新モデル:オフライン1-7日に一度;各セッションでオンラインスコアリング+盗賊の部分的な追加トレーニング。
発行制限:正直ポリシー(レート制限、アワードキャップ、RG制限)。
意思決定ログ:誰/いつ/どのポリシーオプションが表示されるか、チャンス、予想される複雑さ、実際の結果。
5)ミッションジェネレータ(意思決定ロジック)
1.セグメント:クラスター→基本ミッションバスケット(ジャンル、期間)。
2.コンプライアンスフィルタ:プロバイダ、地理、RG制限(毎日の時間制限を含む)。
3.傾向スコアリング:完成確率と期待値による候補者のランキング(EV Retensna)。
4.コンテキストバンディット:ε -explorationで1-2の最良候補を選択します。
5.難易度チューニング:ターゲット(スピン数/ベット数/時間)を周辺ウィンドウ(例:平日の夜/週末)。
6.エミッションキャップ:季節のトークン/化粧品の予算チェック。
7.意味のある代替案:1つのスペアミッションを提供します(X時間ごとに「変更」ボタン)。
6)トーナメントタスクのパーソナライズ
MMRと歴史によるリーグ/ディビジョンの選択はVIPから独立しています(前の記事を参照してください)。
トーナメント内の個々のマイクロ目標:「3プロバイダーをプレイする」「、Nスピン/分≤ペースを維持する」「、トップX%のためのバッジ」-推進力にねじれます。
柔軟な参加ウィンドウ:プレーヤーがより頻繁にオンラインになっている場合のタイムスロット。AIはスクリーニングセッションをお勧めします。
プロフィール別のアワードトラック:化粧品とトークンは希少性を考慮していますが、RTP/プロパティを増やすことはありません。
7) AIの完全性の規則、責任および限界
安全上の制約:1日あたりの最大N個人ミッション。RG疲労信号の複雑さの増加の禁止。
透明性:「ミッションの選択方法」画面:セグメント、コンテキスト、失敗に対する保護(残念なタイマー)、賞のキャップ。
公平性:全員のための同じ賞の天井;パーソナライゼーションは、結果の値ではなくパスを変更します。
責任あるゲーム:ソフトポーズ、「残り」の推奨、毎日の制限-ポリシーに組み込まれています。
プライバシー:集計のみ。規制最小値を超えたモデル機能のPIIはありません。
8)反乱用および反ゲーム
均一なサイクルの検出:ミッションの頻度が高い反復→変動が必要(プロバイダ/ベット/時間)。
ペースキャップ:Xミッション/日、「高速」タスク間のクールダウン。
難易度ガード:下限/上限;鋭いジャンプは禁止されています。
トーナメント共謀:ネットワーク/行動署名、マスターリーグのランダムKYCチェック。
ログ監査:意思決定の説明可能性(理由コード:セグメント、傾向、bandit-arm)。
9)成功指標
パーソナライズされたD7/D30と基本のアップリフト。
ミッション完了率と完了までの時間中央値(TTC)。
粘着性(DAU/MAU)、 Avgセッション長(RGガード付き)。
報酬のジニ分布(同様の努力で均等)。
苦情「不正」とミュート/オプトアウトレートのパーソナライゼーションによるレート。
賞ROI/GGRへの排出-プロモーション経済の持続可能性。
Exploration Cost BanditとRegret-ε/Thompson Samplingをセットアップします。
10)実行するA/Bパターン
1.ミッションタイプ:プロバイダ固有のvsジャンル。
2.ミッションの長さ:短い(≤ 15分)vs媒体(30-40分)。
3.残念なタイマー:同じp₀でハード対ソフト。
4.バンディットアルゴリズム:LinUCB対トンプソン;別のε。
5.ミッション変更:アクセス1/日 vs 2/日。
6.トーナメントのマイクロ目標:1対2の平行。
11)テンプレート(JSON)ミッションとトーナメントのタスク
ミッション(パーソナライズ):json
{
「mission_id": 「m。 s3。var。 playtime。多様性を持っています。001、」 「title」: 「Open three worlds」、 「segment_hint": 「collector」、 「difficulture」: 「medium」、 「requirements」:[
{「type「:「provider_diversity「、「providers」: 3」、 window_min」: 30}、 {「type「:「bet_range」、」 min」: 0。2、 「max」: 1。0}
]、「pity」: {「soft_delta」: 0。02、 「cap」: 0。4、 「hard_after_attempts」: 30}、 「rewards」: {「tokens': 12」、 cosmetic_drop": {「rarity」: 「Rare」、 「p」: 0。12}}、 "caps':{"daily_user_missions': 3"、economy_token_cap": 150}
}
トーナメントのマイクロゴール:
json
{
「task_id": 「t。 s3。修飾子。ペーシング。tempo、 「context」: {「league」: 「gold'、」 time_slot「:」evening「}、」goal「:{」type「:」pace_control'、 「max_spins_per_min」: 45「、duration_min」: 20}「、vip_neutral": true」、 rewards「:{」season_points「:120}、 fafainess」: {「max_value_equivalence」: true}
}
12)生産擬似コード(コンテキストバンディット)
pythonコンテキスト:セグメント、時間、デバイス、最近のTTC、 RGフラグcontext=build_context (user_id)
候補=fetch_candidate_missions (segment=context。セグメント)
候補=compliance_filter(候補、コンテキスト。ジオコンテキスト。RG)
scored=[(m、 propensity_score (m、 context)) for m in champions]
topK=top_by_score(得点、k=5)
盗賊は「手」(腕)を選びます)
選択された=contextual_bandit。choose_arm (topK、 context)
複雑さを調整しましょう+排出予算をパーソナライズ=adjust_difficulty(選択、コンテキスト)
economy_budget_okでない場合(パーソナライズされた):
パーソナライズ=degrade_reward(パーソナライズ)
log_decision (user_id、コンテキスト、パーソナライズ)
配信(パーソナライズ)
13) UXパターン
透明性: 「あなたのスタイルにマッチ:30-40分、3プロバイダー、勝利-珍しい化粧品ドロップ。」
コントロール:ボタン「ミッションを変更する」(クールダウン)、切り替えスイッチ「パーソナライゼーションを無効にする」。
滑らかさ:難易度インジケータ、タイムスコア、TTC予測の進捗バー。
静かなVFX:成功の短いアニメーション;失敗へのフィードバック-+fragments/pity progress。
14)リリースプラン
1.MVP (3-5週間):ミッションのクラスタリング+推進;静的なトーナメントの問題;放出の帽子;透明性スクリーン。
2.v0です。9:コンテキストサグ;ミッション変更;トーナメントでのマイクロゴール;完全なRGガード。
3.v1。0: RLミッションチェーン;社会的目標;ビジュアルコレクション;「正直さ」レポートとログ監査。
4.次:季節のテンプレートの回転、レトロな化粧品のカムバック、プロバイダーとのクロスプロモーション。
15)プレスタートチェックリスト
- パーソナライゼーションはRTP/数学の優位性に影響しません。
- 排出キャップと毎日のミッション制限。
- 残念なタイマーと決定的なマイルストーンが設定されます。
- それがどのように動作するかスクリーン+理由コード。
- RGポリシー:一時停止、制限、「パーソナライゼーションを無効にする」オプション。
- 反乱用:要件の変動性、ペースキャップ、意思決定のログ監査。
- A/B計画と成功しきい値を持つターゲットKPIのリスト。
AIのパーソナライゼーションは「より困難」ではなく、よりスマートです。ミッションとトーナメントのタスクはプレイヤーのスタイルに適応しますが、正直で安全であり、排出量は予算内にあり、ルールは透明です。クラスタリング+プロペンシティは基礎を提供し、コンテキストバンディットはディスプレイを最適化し、RLはチェーンを改善します。これらすべては明確な制約、RGガード、およびインテリジェントなコミュニケーション「ターゲットをどのように選択するか」でのみ機能します。