खिलाड़ी व्यवहार और वरीयताओं की एआई मॉडलिंग
पूरी कहानी
एक खिलाड़ी सूक्ष्म-निर्णयों का एक क्रम है: अंदर जाएं, एक खेल चुनें, एक शर्त रखें, रोकें, वापस आएं। एआई आपको इन संकेतों को भविष्यवाणियों (प्रतिधारण, बहिर्वाह, एलटीवी), सिफारिशों (गेम/मिशन/बोनस) और निवारक उपायों (सीमाएं, ठहराव, आरजी अलर्ट) में बदलने की अनुमति देता है। लक्ष्य "हर कीमत पर मैट्रिक्स को निचोड़ ना" नहीं है, बल्कि एक स्थिर संतुलन खोजने के लिए है: बढ़ ते व्यावसायिक मूल्य और खिलाड़ी सु
1) डेटा: क्या इकट्ठा करना है और कैसे संरचना करना है
घटनाएँ:- सत्र (इन/आउट टाइम, डिवाइस, ट्रैफिक चैनल)।
- लेन - देन (जमा/निकासी, भुगतान विधियां, मुद्राएं, देरी)।
- खेल क्रियाएं (दांव/विजेता, स्लॉट अस्थिरता, प्रदाता द्वारा आरटीपी, खेल परिवर्तन आवृत्ति)।
- विपणन (ऑफ़र, अभियान, यूटीएम, प्रतिक्रिया)।
- व्यवहार आरजी सिग्नल (दर निर्माण की दर, रात के सत्र, "नुकसान का पीछा करना")।
- सामाजिक/सामुदायिक संकेत (चैट, टूर्नामेंट/मिशन भागीदारी, यूजीसी)।
- इवेंट स्ट्रीमिंग (काफ्का/काइनेसिस) → कोल्ड स्टोरेज (डेटा लेक) + डिस्प्ले केस (DWH)।
- रियल-टाइम स्कोरिंग के लिए ऑनलाइन फीचर स्टोर।
- एकल कुंजी: player_id, session_id, campaign_id।
2) फिकी: सिग्नल का निर्माण सेट
इकाइयाँ और आवृत्तियाँ:- RFM: पुनरावृत्ति, आवृत्ति, मौद्रिक (1/7/30/90 दिनों के लिए)।
- पेस: खेल में it जमा/शर्त/समय (MoM/DoD)।
- सत्रों की लय: घंटे/दिन चक्र, मौसमी।
- स्वाद प्रोफ़ाइल: प्रदाता, शैलियाँ (स्लॉट, लाइव, क्रैश/एविएटर), अस्थिरता दर।
- "संज्ञानात्मक" जटिलता: निर्णय लेने की गति, औसत सत्र की लंबाई थकान।
- एन-ग्राम के खेल (संक्रमण "igra→igra")।
- समय श्रृंखला: पास, "लूप्स" (अपने पसंदीदा खेल पर लौटें), प्रोमो की प्रतिक्रिया।
- जमा की असामान्य वृद्धि, "डोगन" हारने के बाद, रात मैराथन।
- स्व-बहिष्करण/ठहराव ट्रिगर (यदि सक्षम है), बोनस "चयन" गति।
3) कार्य और मॉडल
3. 1 वर्गीकरण/स्कोरिंग
मंथन: लॉजिस्टिक रिग्रेशन/ग्रेडिएंट बूस्टिंग/टैबनेट।
धोखाधड़ी/बहु-एसीसी: अलगाव वन, कनेक्शन के ग्राफ मॉडल, उपकरणों/भुगतान विधियों के लिए जीएनएन।
आरजी जोखिम: विसंगति पहनावा + दहलीज नियम, कानूनी अंशांकन।
3. 2 प्रतिगमन
LTV/CLV: गामा-गामा, BG/NBD, XGBoost/LightGBM, लेन-देन अनुक्रम ट्रांसफार्मर।
ARPPU/ARPU पूर्वानुमान: ढाल बढ़ाने + कैलेंडर मौसमी।
3. 3 अनुक्रम
खेल की सिफारिशें: अनुक्रम 2 अनुक्रम (GRU/LSTM/ट्रांसफॉर्मर), सत्र item2vec/Prod2Vec।
गतिविधि का समय पूर्वानुमान: टीसीएन/ट्रांसफॉर्मर + कैलेंडर सुविधाएँ।
3. 4 ऑनलाइन ऑर्केस्ट्रेशन
प्रासंगिक डाकू (LinUCB/थॉम्पसन): एक सत्र में एक प्रस्ताव/मिशन चुनना।
रिन्यूअल लर्निंग (आरएल): "ओवरहीटिंग के बिना पकड़" नीति (इनाम = दीर्घकालिक मूल्य, आरजी जोखिम/थकान दंड)।
एमएल पर नियम: व्यावसायिक प्रतिबंध (आप एक पंक्ति एन समय में एक प्रस्ताव नहीं दे सकते हैं, अनिवार्य "ठहराव")।
4) निजीकरण: क्या और कैसे सिफारिश करें
निजीकरण वस्तुएँ:- खेल/प्रदाता, सट्टेबाजी की सीमा (आराम रेंज)।
- मिशन/quests (कौशल-आधारित, बिना नकद पुरस्कार - अंक/स्थिति के)।
- बोनस ("कच्चे" पैसे के बजाय फ्रीस्पिन/कैशबैक/मिशन)।
- समय और संचार चैनल (पुश, ई-मेल, ऑनसाइट)।
- "मिश्रित शीट": 60% व्यक्तिगत रूप से प्रासंगिक, 20% नया, 20% सुरक्षित "अनुसंधान" स्थिति।
- "सुरंग" के बिना: हमेशा एक बटन "चयनित शैलियों से यादृच्छिक", एक ब्लॉक "वापसी"...।
- नरम संकेत: "यह एक ब्रेक लेने का समय है", "सीमाओं की जाँच करें।"
- लंबे सत्र के बाद "हॉट" ऑफर का ऑटो-छिपाना; प्राथमिकता - बिना दांव के मिशन/quests।
5) धोखाधड़ी और ईमानदारी
उपकरण/भुगतान ग्राफ: सामान्य पैटर्न के साथ "खेतों" की पहचान करना।
भुगतान विधि/भू/दिन के समय द्वारा जोखिम स्कोरिंग।- प्रचार कोड का ए/बी संरक्षण: माउथगार्ड, वेग सीमा, "प्रोमो शिकार" डिटेक्टर।
- सर्वर-आधिकारिक: महत्वपूर्ण प्रगति और बोनस गणना - केवल बैकएंड पर।
6) उत्पादन में वास्तुकला
ऑनलाइन परत: इवेंट फ़्लो → फ़िचेस्टोर → ऑनलाइन स्कोरिंग (REST/gRPC) → ऑर्केस्ट्रेटर ऑफ़ र/कंटेंट।
ऑफ़ लाइन परत: मॉडल प्रशिक्षण, रिट्रेनिंग, ए/बी, बहाव निगरानी।
नियम और अनुपालन: नीति-इंजन (सुविधा झंडे), आरजी/एएमएल के लिए "लाल सूची"।
अवलोकन: मैट्रिक्स में देरी, एसएलए स्कोरिंग, ट्रेसिंग निर्णय (एक प्रस्ताव जारी करने के कारण)।
7) गोपनीयता, नैतिकता, अनुपालन
डेटा कम से कम: केवल आवश्यक क्षेत्र; PII - एक अलग एन्क्रिप्टेड लूप में।
व्याख्यात्मकता: SHAP/संपूर्ण कारण: "प्रस्ताव एक्स/वाई के कारण दिखाया गया है।"
निष्पक्षता: आयु/क्षेत्र/उपकरण पूर्वाग्रह जांच; आरजी हस्तक्षेप के समान थ्रेसहोल्ड।
कानूनी आवश्यकताएं: निजीकरण सूचनाएं, ऑप्ट-आउट विकल्प, निर्णय लॉग का भंडारण।
आरजी प्राथमिकता: यदि जोखिम अधिक है, तो निजीकरण "प्रतिबंध" मोड पर स्विच करता है, न कि "उत्तेजना"।
8) सफलता मैट्रिक्स
उत्पाद:- प्रतिधारण -, यात्राओं की आवृत्ति, स्वस्थ सत्र की लंबाई का मतलब है।
- लक्ष्य गतिविधियों (quests/मिशन), कैटलॉग गहराई में रूपांतरण।
- व्यक्तिगत सहकर्मियों द्वारा LTV/ARPPU का उत्थान।
- ऑफ़ र की दक्षता (सीटीआर/सीआर), "रिक्त" ऑफ़ र का हिस्सा।
- आरजी घटनाएं/1000 सत्र, स्वैच्छिक ठहराव/सीमाओं का अनुपात।
- झूठी सकारात्मक/नकारात्मक विरोधी धोखाधड़ी, पता लगाने का समय।
- शिकायतें/अपील और उनका औसत प्रसंस्करण समय।
- बहाव सुविधा/लक्ष्य, रिट्रेन आवृत्ति, offline→online गिरावट।
9) कार्यान्वयन रोडमैप
स्टेज 0 - फाउंडेशन (2-4 सप्ताह)
घटनाओं का आरेख, DWH में शोकेस, बेसिक फिसेस्टर।- आरएफएम विभाजन, सरल आरजी/धोखाधड़ीनियम।
चरण 1 - पूर्वानुमान (4-8 सप्ताह)
मंथन/एलटीवी मॉडल, पहली सिफारिशें (आइटम 2vec + लोकप्रियता)।
मैट्रिक्स के डैशबोर्ड, नियंत्रण होल्डआउट।
स्टेज 2 - रियलटाइम निजीकरण (6-10 सप्ताह)
ऑफ़ र के ऑर्केस्ट्रेटर, प्रासंगिक डाकू।- ऑनलाइन प्रयोग, आरजी द्वारा अनुकूली माउथगार्ड।
चरण 3 - उन्नत तर्क (8-12 सप्ताह)
अनुक्रम मॉडल (ट्रांसफॉर्मर), झुकाव के खंड (अस्थिरता/शैलियों)।
"सुरक्षित" जुर्माना, ग्राफ विरोधी धोखाधड़ी के साथ आरएल नीति।
चरण 4 - स्केल (12 + सप्ताह)
क्रॉस-चैनल एट्रिब्यूशन, मिशन/टूर्नामेंट निजीकरण।- जिम्मेदार खिलाड़ी के लिए स्वायत्त "गाइड", सत्र में समर्थक सुझाव।
10) सर्वश्रेष्ठ प्रथा
डिफ़ॉल्ट रूप से सुरक्षा-पहला: निजीकरण को जोखिम नहीं बढ़ाना चाहिए।
"एमएल + नियम" संकर: मॉडल पर व्यापार की बाधाएं।
सूक्ष्म प्रयोग: तेज ए/बी, छोटे वेतन वृद्धि; निर्धारण रेलिंग।
UX पारदर्शिता: खिलाड़ी को स्पष्टीकरण "यह सिफारिश क्यों।"
मौसमी: छुट्टियों/घटनाओं के लिए कैटलॉग को पुनः प्राप्त करना और फिर से अनुक्रमण करना।
समर्थन के साथ तुल्यकालन: वृद्धि परिदृश्य, सीआरएम में ऑफ़ र और मैट्रिक्स की दृश्यता।
11) विशिष्ट त्रुटियां और उनसे कैसे बचें
ऑफ़ लाइन स्कोरिंग केवल: ऑनलाइन निजीकरण के बिना "अंधा। "→ fichestore और realtime समाधान जोड़ें।
ऑफ़ र द्वारा ओवरहीटिंग: छोटा उत्थान, लंबा नुकसान। → आवृत्ति कैप, सत्रों के बाद "ठंडा"।
आरजी संकेतों की अनदेखी: नियामक और प्रतिष्ठा जोखिम। → प्रत्येक समाधान में आरजी झंडे।
अखंड मॉडल: बनाए रखना मुश्किल। → कार्यों द्वारा Microservices (मंथन, recsys, धोखाधड़ी)।
कोई स्पष्टीकरण नहीं: शिकायतें और ब्लॉक। → कारणों के लॉग, SHAP-स्लाइस, अनुपालन के लिए रिपोर्ट।
12) चेकलिस्ट लॉन्च करें
- घटना शब्दकोश और समान आईडी।
- Fichestor (ऑफ़लाइन/ऑनलाइन) और SLA स्कोरिंग।
- चुरन/एलटीवी बेस मॉडल + सिफारिश शोकेस।
- डाकुओं और रेलिंग आरजी के साथ ऑफ़ र का ऑर्केस्ट्रेटर।
- उत्पाद/व्यवसाय/आरजी/धोखाधड़ीमेट्रिक्स के डैशबोर्ड।
- गोपनीयता, व्याख्याता, ऑप्ट-आउट नीतियां।
- रिट्रेन प्रक्रिया और बहाव निगरानी।
- रनबुक की घटनाएं और वृद्धि।
खिलाड़ी व्यवहार और वरीयताओं का एआई मॉडलिंग एक "जादू बॉक्स" नहीं है, लेकिन एक अनुशासन: उच्च गुणवत्ता वाला डेटा, विचारशील विशेषताएं, उपयुक्त मॉडल, सख्त सुरक्षा नियम और निरंतर प्रयोग। "निजीकरण + जिम्मेदारी" का संयोजन जीतता है: दीर्घकालिक मूल्य बढ़ ता है, और खिलाड़ियों को एक ईमानदार और आरामदायक अनुभव मिलता है।