अवलोकन: मैट्रिक्स, लॉग, आईगेमिंग में ट्रेसिंग
1) iGaming में अवलोकन क्यों है
खिलाड़ी वास्तविक समय की देरी और दुर्घटनाओं (लाइव गेम, दांव, टूर्नामेंट) के प्रति संवेदनशील हैं। लॉगिन/जमा/निकासी का कोई भी क्षरण राजस्व और विश्वास को प्रभावित करता है। अवलोकन होगा:- L3-L7, अनुप्रयोगों और व्यवसाय का एक स्नैपशॉट प्रदान करें
- जल्दी से सामने, एपीआई, गेम प्रदाताओं, भुगतानों के बीच अड़ चनों का स्थानीयकरण;
- "सुंदर" तकनीकी मैट्रिक्स से स्पष्ट रूप से अलग उत्पाद फ़ाइलें (शर्त लगाना असंभव है)।
कुंजी: SLO (सेवा स्तर की वस्तुओं) उत्पाद प्रवाह के साथ प्रारंभ करें, और केवल तब मेट्रिक्स/लॉग/ट्रेस चुनें।
2) उत्पाद SLO और त्रुटि बजट
एसएलओ के उदाहरण (30 दिनों से अधिक):- लॉगिन: सफलता ≥ 99। 90%, p95 विलंबता ≤ 250 एमएस।
- जमा ('/भुगतान/जमा ') और निष्कर्ष: सफलता ≥ 99। 85%, p95 ≤ 400 ms।
- रियल टाइम शर्त: सफलता ≥ 99। 9%, p95 WS संदेश ≤ 120 ms।
- लाइव गेम का स्लॉट/सत्र शुरू करना: सफलता ≥ 99। 8%, p95 ≤ 800 ms।
त्रुटि बजट को रिलीज नीति में अनुवाद किया जाता है: यदि> 50% का उपयोग किया जाता है - स्टॉप-फीचर/कैनरी जमा केवल;> 80% - केवल बग सुधार।
3) टेलीमेट्री की "थ्री व्हेल"
मेट्रिक्स (राज्य परिमाणीकरण)
कस्टम एपीआई के लिए RED: प्रत्येक समापन बिंदु/विधि के लिए दर, त्रुटियां, अवधि।
बुनियादी ढांचे के लिए उपयोग: उपयोग, संतृप्ति, त्रुटियां (सीपीयू, मेमोरी, आईओ, कनेक्शन, कतारें)।
व्यावसायिक मैट्रिक्स: registratsii→depozit रूपांतरण, सफलता दर, सक्रिय लाइव कैसीनो तालिकाओं की संख्या, औसत उद्धरण देरी।
लॉग (तथ्य और संदर्भ)
आवश्यक क्षेत्रों के साथ संरचित JSON घटनाएँ: 'ts', 'level', 'service', 'env', 'span _ id', 'span _ id' (seuducied), 'suse _ id', 'state', 'latencomes', 'मुद्रा।
श्रेणी: ऑडिट (अधिकारों/संतुलन में परिवर्तन), व्यावसायिक घटनाओं (दर, जमा), त्रुटियां (स्टैक/कोड), तकनीकी समर्थन (चेतावनी/जानकारी)।
ट्रेसिंग (कारण और प्रभाव)
एंड-टू-एंड फ्रंट → एपीआई → जोखिम इंजन → गेम प्रदाता/भुगतान → कतारें/डेटाबेस के माध्यम से।
वाइड त्रुटि नमूना (100%), "धीमी" अनुरोधों का अनुकूली नमूना (उदा। p95 +), डिफ़ॉल्ट रूप से 1-5% सफलता यातायात।
4) मेट्रिक्स डिजाइन: क्या शूट करना है और क्या कॉल करना है
प्रोमेथियस मेट्रिक्स (छद्म) के उदाहरण:
RED по платежам ig_payments_requests_total{route="/payments/deposit,"method="POST,"provider="card" काउंटर}}
काउंटर ig_payments_errors_total{route="/payments/deposit,"code="5xx,"provider="card"}
hist ig_payments_latency_seconds_bucket{route="/payments/deposit,"le="0। 25"}
गेज}}
Бизнес काउंटर ig_bet_placed_total{game="slot,"provider="PragmaticPlay,"currency="EUR"}
hist}}
गेज}}- लेबल का एक एकल ऑन्कोलॉजी: 'एनवी', 'क्षेत्र', 'बाजार', 'प्रदाता', 'मार्ग', 'गेम', 'भुगतान _ विधि'।
- कार्डिनैलिटी को न उड़ाएँ: मेट्रिक्स में 'उपयोगकर्ता _ id' सीमित करें (केवल लॉग/ट्रैक्स में)।
5) लॉग: संरचना, गोपनीयता, प्रतिधारण
महत्वपूर्ण कार्यों के लिए न्यूनतम Js
json
{
"ts ":" 2025-10-23T17: 41:26।  "," स्तर ":" INFO "," सेवा ":" भुगतान-एपी "," एनवी ":" प्रोड ","  ""  "" ,/उर्फ, ईमेल/फोन नहीं
"" मार्ग ": "/भुगतान/जमा", "स्थिति": 200 "," राशि ": 100। 0, "मुद्रा":" ईयूआर", "प्रदाता":" कार्ड", "bin_country":"DE"
}- मास्क/बाहर पैन/सीवीवी, टोकन, पासवर्ड, जेडब्ल्यूटी - यहां तक कि डिबग में।
- ट्रेस ('trace _ id') और ग्राहक (उर्फ 'user _ pid') को लॉग बांधता है।
- टीटीएल: "शोर" प्रौद्योगिकीविद् 14-30 दिन, ऑडिट ट्रेल 1-3 साल (नीति और कानून द्वारा), बिजनेस लॉग 6-24 महीने (छद्म नाम)।
- WORM/प्रतिरक्षा के लिए ऑडिट (अपरिवर्तित बाल्टी), ACL भूमिका द्वारा।
6) ट्रेसिंग: सामने से प्रदाता तक
विस्तारित प्रवाह
लॉगिन/पंजीकरण - एंटी-बॉट्स/WAF Auth-API प्रोफाइल/वॉलेट।- जमा करें → भुगतान-एपीआई → प्रदाता → वेबहूक → बटुआ-सेवा।
- बेट गेम-गेटवे (वेबसॉकेट) गेम प्रदाता - वॉलेट की जीत की गणना करता है।
रणनीति
OpenTelemetry हर जगह है: SDK सामने (XHR/Fetch), मोबाइल पर, API में, श्रमिकों में।
संदर्भ प्रोटोकॉल: W3C traceparent/tracestate; gRPC/HTTP/WebSocket (WS में - पहले मेटाडेटा/संदेशों में) के माध्यम से फ्लिक करें।
अनुकूली नमूना: त्रुटियों के लिए 100%, भुगतान निष्कर्ष के लिए %, "नए" रिलीज/कैनरी के लिए%, 1-5% पृष्ठभूमि।
ट्रेस दृश्य में दृश्य टैग: 'जोखिम _ निर्णय', 'प्रदाता _ name', 'बोनस _ id', 'जैकपॉट _ राउंड'।
7) रियल-टाइम चैनल: वेबसॉकेट/वेबआरटीसी
Метрики: 'ws _ disconnect _ session', 'ws _ messions _ in _ flight', 'ws _ send _ latency _ ms', 'ws _ disconnect _ couse'।
घटनाओं का पता लगाएं: 'ws _ subscribe _ table', 'ws _ better _ place', 'ws _ bellation'।
लॉग: संदेश आकार/आवृत्ति को सामान्य करें; ट्रैक "खाली पिंग्स" और बाढ़ पैटर्न।
WebRTC (लाइव कैसीनो) के लिए: 'जिटर _ ms', 'पैकेट _ लॉस', 'राउंड _ trip _ time _ ms', 'कीफ्रेम _ इंटरवल _ s'।
8) अलर्टिंग: लक्षणों से लेकर कारणों तक
रोगसूचक अलर्ट (SLO/SLA):- लॉगिन SLI त्रुटि> 0. 5 मिनट में 3%।
- p95 '/भुगतान/जमा '> एक पंक्ति में 400 ms 10 मिनट।
- सट्टेबाजी की सफलता <99। 15 मिनट में 7%।
- 'db _ connections _ saturation> 0। 85 '5 мин;' कतार _ लाग _ सेकंड> 30 '।
- '429 '/' 5xx' एक ASN से फट गया - WAF/बॉट मैनेजर को सिग्नल।
- एलर्ट केवल लगातार हानि में; डुप्लिकेट्स का ऑटो-जैमिंग; रनबुक करने के लिए मार्ग।
9) डैशबोर्ड जो वास्तव में मदद करते हैं
"जमा प्रवाह"
फ़नल: प्रदाता → फ्लॉपी → वॉलेट अपडेट के लिए अनुरोध करें → पुनर्निर्देशित करें।
प्रदाता द्वारा सफलता/त्रुटियां, बिन देश मानचित्र, p95/99 विलंबता, त्रुटि कोड का वितरण।
"लाइव गेम्स/बेट्स"
सक्रिय तालिकाएं, ऑनलाइन खिलाड़ी, p95 WS देरी, टाइमआउट/एबॉर्ट्स, शीर्ष त्रुटि गेम साझा करें।
"एपीआई हेल्थ"
प्रमुख मार्गों पर RED, 4xx/5xx, कनेक्शन पूल संतृप्ति/CPU/GC, शीर्ष N धीमी गति से समापन बिंदु (ट्रेस में लिंक के साथ)।
10) लागत और भंडारण: कैसे नहीं जाना है
कार्डिनैलिटी बजट: लेबल/विशेषताओं पर सीमा; पीआर समीक्षा करता है कि मेट्रिक्स जोड़ें।
Tiered भंडारण: गर्म 3-7 दिन (त्वरित खोज), गर्म 30-90 दिन (S3/ऑब्जेक्ट), ठंडा संग्रह (कम अक्सर)।
डाउनसैम्पलिंग मेट्रिक्स (1s → 10s → 1m) और रोलिंग एकत्रीकरण।
रीट्रे और आइडेम्पोटेंट कॉल से लॉग का डीडुप्लीकेशन।
11) गोपनीयता और अनुपालन (छोटा)
छद्म नाम 'उपयोगकर्ता _ id', लॉग में ई-मेल, फोन, पासपोर्ट स्टोर न करें।
एन्क्रिप्ट ट्रांसपोर्ट (mTLS) और बाकी, अलग-अलग एक्सेस (RBAC/MFA), डेटा एक्सेस लॉग बनाए रखें।
डेटा मैट्रिक्स के रूप में टीटीएल/प्रतिधारण; "डिलीट करने का अधिकार" ऐतिहासिक सेटों में निष्क्रियता झंडे और छद्म नाम के माध्यम से लागू किया जाता है।
12) घटनाएं और ट्रेस डिबगिंग: त्वरित नुस्खा
1. एक रोगसूचक चेतावनी (जमा सफलता) काम किया।
2. डैशबोर्ड ने प्रत्येक प्रदाता की वृद्धि दिखाई।
3. ट्रेस दृश्य में क्लिक करें: 'प्रदाता _ कॉलबैक' पर एक लंबा कदम (p99 2। 3 एस), कई रेट्रा।
4. लॉग: 'टाइमआउट' + ASN = बॉट पैटर्न होस्टिंग।
5. कार्रवाई: कोलबैक पर उठाए गए टाइमआउट, ASN के लिए WAF में JS चुनौती, सीमित रेट्रास शामिल थे।
6. रेट्रो: SLI को 'callback _ emply _ ratio' पर जोड़ा गया, 'कतार _ lag _ second' पर अलर्ट करें।
13) चरण द्वारा कार्यान्वयन
1. 4-6 महत्वपूर्ण प्रवाह (लॉगिन, जमा, आउटपुट, गेम लॉन्च, शर्त) के लिए एसएलओ डिजाइन।
2. RED/USE + व्यवसाय SLI मैट्रिक्स; एकल लेबल योजना।
3. 'ट्रेस _ आईडी' के साथ संरचनात्मक लॉग; संवेदनशील क्षेत्रों में मास्
4. OpenTelemetry हर जगह है; अनुकूली नमूना।
5. डैशबोर्ड + अलर्ट (रोगसूचक और कारण), रनबुक।
6. लागत प्रबंधन: कार्डिनैलिटी, डाउनसैम्पलिंग, भंडारण स्तर।
7. अभ्यास: गेमडे परिदृश्य (भुगतान ड्रॉप, प्रदाता अंतराल, डब्ल्यूएस उछाल)।
8. निरंतर सुधार: नई विशेषताएं दिखाई देने पर SLI जोड़ें, "अंधे स्थानों" को बंद करें।
14) सूची की जाँच करें (प्रोड-रेडी)
- एसएलओ/एसएलआई अनुमोदित, रिलीज नीति में त्रुटि बजट।
- RED/USE metrics + बिजनेस मेट्रिक्स एक एकल लेबल ऑन्टोलॉजी के साथ।
- JSON लॉग, मास्किंग रहस्य, प्रत्येक संदेश में 'ट्रेस _ आईडी'।
- एंड-टू-एंड ट्रेसिंग (HTTP/gRPC/WebSocket/WebRTC), W3C संदर्भ।
- अलर्ट रोगसूचक और कारण हैं, बिना शोर के, रनबुक में लिंक।
- जमा, दरों, एपीआई स्वास्थ्य के लिए डैशबोर्ड; 'प्रोवाइडर/बाजार' द्वारा त्वरित फिल्टर।
- नमूना/कार्डिनैलिटी नियंत्रण में, स्तरीय भंडारण।
- गोपनीयता: अलियासिंग, एन्क्रिप्शन, आरबीएसी/एमएफए, मेटा लॉग।
- ड्रिल और रेट्रो, नियमित एसएलओ संशोधन।
सारांश फिर से शुरू करें
IGaming की अवलोकन "CPU ग्राफिक्स" नहीं है, बल्कि एक वास्तविक समय की उत्पाद तस्वीर है: SLO महत्वपूर्ण प्रवाह, RED/USE मेट्रिक्स, सुसंगत लॉग और खिलाड़ी के पूरे मार्ग और पैसे। एक गलत बजट पर अलर्ट का अनुशासन जोड़ें, टेलीमेट्री की लागत को नियंत्रित करें, गोपनीयता का निरीक्षण करें - और टीम अनुमान नहीं लगाएगी, लेकिन खिलाड़ियों को नोटिस करने से पहले समस्याओं के कारणों को देखें और उन्हें ठीक करें।
