IGaming में विफल और बैकअप कैसे काम करते हैं
IGaming को एक विशेष DR/BCP अनुशासन की आवश्यकता क्यों है
एक कैसीनो प्लेटफ़ॉर्म रियल-टाइम मनी (वॉलेट/लेजर), लाइव राउंड (आरएनजी/लाइव), भुगतान, सहयोगी और सख्त अनुपालन है। कोई भी पहुंच छेद जल्दी से वित्तीय और कानूनी जोखिमों में बदल जाता है। इसलिए, वास्तुकला अनुमानित वसूली के आसपास बनाई गई है: ज्ञात लक्ष्य, ज्ञात परिदृश्य, पूर्वाभ्यास प्रक्रियाएं
बुनियादी उद्देश्य और शर्तें
आरटीओ - रिकवरी समय उद्देश्य
वॉलेट/लेजर के लिए: ≤ 60-300 सेकंड (इंट्रारेजिनल फीलओवर), ≤ 15 मिनट (इंटरग्रेजनल डीआर)।
वसूली बिंदु उद्देश्य (आरपीओ) - स्वीकार्य डेटा हानि।
बही के लिए: 0-5 सेकंड (तुल्यकालिक/अर्ध-तुल्यकालिक प्रतिकृति), रिपोर्टिंग के लिए: ≤ 15 मिनट।
एसएलए और त्रुटि बजट: परिवर्तन और स्थिरता की दर के बीच व्यापार-बंद को औपचारिक बनाएं।
दोष सहिष्णुता परतें
1) बुनियादी ढांचा: बहु-AZ/बहु-क्षेत्र
मल्टी-एजेड (न्यूनतम 3 क्षेत्र): सभी महत्वपूर्ण सेवाएं क्षेत्रों, स्वचालित डेटाबेस/बस विफलता द्वारा वितरित की जाती हैं।
मल्टी-रीजन डीआर: "हॉट" (एक्टिव-एक्टिव) या "वार्म" (एक्टिव-पैसिव) अधिकार क्षेत्र (डेटा रेजिडेंसी) द्वारा अलगाव के साथ दूसरा क्षेत्र।
निर्धारित कर रहा है कि कब कौन सा मोड:- सक्रिय-सक्रिय: दो क्षेत्रों में खिलाड़ियों के लिए कम विलंबता, गणना के लिए घटना तुल्यकालन + सख्त एकल "सत्य का स्थान" के माध्यम से क्रॉस-क्षेत्र खाता।
- सक्रिय-निष्क्रिय (गर्म): सरल और सस्ता; निष्क्रिय गर्म उदाहरण + डेटाबेस प्रतिकृतियां रखता है, लेकिन यातायात की सेवा नहीं करता है।
2) नेटवर्क और परिधि
स्वास्थ्य जांच के साथ डुप्लिकेटेड इंग्रेस/WAF, Anycast या DNS फीलओवर।
कैश रजिस्टरों और प्रदाताओं के लिए अलग-अलग एग्रेस गेटवे, दोनों क्षेत्रों में अनुमत आईपी की सूची।
3) डेटा और कतारें
संबंधपरक डेटाबेस (पोस्टग्रेस): पैट्रोनी/प्रबंधित एचए, एजेड में तुल्यकालिक प्रतिकृतियां, डीआर क्षेत्र में अतुल्यकालिक प्रतिकृति (अंतराल निगरानी के साथ)। हर एन मिनट + WAL संग्रह में स्नैपशॉट के साथ PITR।
OLAP (क्लिकहाउस/BigQuery): प्रतिकृति/शार्डिंग; नुकसान ऊपर स्वीकार्य है (15-30 मिनट तक RPO)।
कैश (रेडिस): असफलता के साथ एक समूह, लेकिन सच्चाई का स्रोत नहीं; स्विचिंग के दौरान - वार्म-अप।
इवेंट बस (काफ्का/एनएटीएस): दर्पण समूह और/या क्रॉस-क्लस्टर-मिररिंग, कम से कम एक बार वारंटी, उपभोक्ताओं पर पहचान नियंत्रण।
4) अनुप्रयोग और डोमेन
बटुआ/खाता: सख्त स्थिरता के साथ स्टेटफुल कोर, प्रति क्षेत्र एक "मास्टर लेखक"; अंतःक्षेत्रीय डीआर के साथ - डबल एंट्री लॉक के साथ "निर्वाचित लेखक" प्रक्रिया।
गेम ब्रिज/एपीआई: स्वास्थ्य जांच के लिए स्टेटलेस, क्षैतिज फीलर; सभी वित्तीय रास्तों के लिए idempotic कुंजी।
बोनस/सूचना/ईटीएल: विलंबित प्रसंस्करण की अनुमति दें, कतारों से पुनः आरंभ करें।
बॉक्स ऑफिस (PSP/crypt): मल्टी-प्रदाता रणनीति (प्रति देश कम से कम 2 रेल), व्यापारियों/समापन बिंदुओं का तेजी से स्विच।
5) लाइव स्ट्रीम्स
क्षेत्रीय किनारे नोड्स के साथ WebRTC/LL-HLS गेटवे; WebRTC क्षरण के तहत LL-HLS पर गिरावट मार्ग।
खिलाड़ी के बाहर सट्टेबाजी तर्क रखना ताकि धारा को फिर से शुरू करने से गणना प्रभावित न हो।
फेलओवर पैटर्न
एसेट-एसेट (द्वि-क्षेत्रीय)
पेशेवरों: न्यूनतम आरटीओ/आरपीओ, खिलाड़ियों के लिए निकटता।
विपक्ष: बही जटिलता और रिकॉर्डिंग संघर्ष, महंगी ग्रिड।
अभ्यास: "एक लेखक प्रति डोमेन" + एक पड़ोसी क्षेत्र में राज्यों को पुन: पेश करने के लिए सोर्सिंग।
परिसंपत्ति-दायित्व (गर्म)
पेशेवरों: मूल्य/कठिनाई संतुलन।
विपक्ष: ऊपर आरटीओ, एक निष्क्रिय क्षेत्र को "बढ़ावा" देने के लिए एक सिद्ध योजना की आवश्यकता है।
अभ्यास: बटुआ स्विच करते समय स्वचालन + मैनुअल पुष्टि (4-आंख सिद्धांत)।
इंट्रारेजनल (मल्टी-एजेड)
डेटाबेस/कैश/इंग्रेस ऑटोफेलर।- कोई DNS/Anycast परिवर्तन, RTO सेकंड-मिनट।
डाटा क्लास द्वारा बैकअप
सिद्धांत:- बैकअप को आराम और पारगमन में एन्क्रिप्ट किया जाता है, कुंजियों को KMS/HSM में एन्क्रिप्ट किया जाता है।
- महत्वपूर्ण बैकअप (मिटाने योग्य सुरक्षा/रैंसमवेयर) के लिए अपरिवर्तनीय मोड (WORM)।
- मेटाडेटा के साथ बैकअप की सूची (स्कीमा संस्करण, WAL विंडो, चेकसम)।
- PITR खाते के लिए अनिवार्य है।
डेटा और पहचान: एक फीलर के साथ "छेद" से कैसे बचें
'शर्त' अनुरोध पर idempotionKey। जगह ',' भुगतान। अनुरोध ',' कैशियर। वेबहुक '।
लेजर - केवल एपेंड-केवल: दोहराया समझौता एक सुधार प्रविष्टि बनाएगा, न कि "पुनर्लेखन"।
लेखक भूमिकाओं को स्विच करते समय रेसिंग के खिलाफ लेन-देन ताले/संतुलन संरक्षण।
इवेंट डिडुप्लिकेशन (उपभोक्ता-पक्ष, प्रमुख क्षेत्रों द्वारा हैश)।
नकद रजिस्टर, पीएसपी और क्रिप्ट: प्लान बी हमेशा शामिल होता है
भुगतान विधि (कार्ड/AWP) के लिए कम से कम दो प्रदाता, दोनों क्षेत्रों में पूर्व-स्थापित व्यापारी खाते।
स्टेबलकॉइन के लिए - दो नेटवर्क (उदाहरण के लिए, TRC-20 और ERC-20) और दो ऑन/ऑफ-रैंप प्रदाता।
पेआउट राउटर: विफलता के मामले में, पीएसपी तुरंत बैकअप पर स्विच करता है, कारणों का एक लॉग रखता है।
KYT/AML धाराओं की नकल की जाती है; यदि बाहरी सेवा उपलब्ध नहीं है - मैनुअल वृद्धि के साथ "अपमानित मोड"।
परिचालन प्रक्रिया (रनबुक)
स्वचालित
हेल्थ चेक चेन इंग्रेस → API → वॉलेट → डेटाबेस → प्रदाता।- बटुआ अपमानित होने पर "भारी" कार्यों (टूर्नामेंट/मिशन) का स्वचालित अक्षम होना।
- घातीय ठहराव और सख्त समय सीमा के साथ टाइमआउट/रिट्रीट।
मैनुअल (पुष्टि के साथ)
डीआर-क्षेत्र को एक संपत्ति में बढ़ावा देना: चरणों, लॉगिंग, कॉम-टेम्पलेट (समर्थन/भागीदार/नियामक) द्वारा चेकलिस्ट।
राउंड द्वारा मुआवजा/VOID: कारण कोड, वीडियो गाइड से लिंक, जिम्मेदार लोगों के हस्ताक्षर।
दोहरे नियंत्रण के साथ भुगतान की अवहेलना।
व्यायाम और तत्परता की जाँच
गेम डे/कैओस ड्रिल मासिक: AZ, डेटाबेस गिरावट, प्रदाता ड्रॉप को बंद करना।
पूर्ण डीआर रिहर्सल त्रैमासिक: डीआर क्षेत्र को "पूर्ण विकास में" बढ़ाएं, दांव/भुगतान के वास्तविक परिदृश्य चलाएं।
परीक्षण पुनर्स्थापित करें: बही को समय टी पर बहाल करें, नियंत्रण P&L और हैश स्लाइस के साथ जांचें।
अनुपालन के साथ तालिका-शीर्ष: कौन और किसको सूचित करता है कि कौन सी रिपोर्ट उत्पन्न होती है (नियामक, पीएसपी, सहयोगी)।
अवलोकन और फीलओवर संकेत
SLO मैट्रिक्स: पर्स p95 विलंबता, शेयर 'बेट। अस्वीकृत ', राउंड सेटल टाइम, पेआउट एसएलए, डेटाबेस प्रतिकृति लैग, काफ्का उपभोक्ता अंतराल।
स्विचिंग घटनाएँ: अलर्ट "भूमिका परिवर्तन", "प्रतिकृति अंतराल> एक्स", "ऑब्जेक्ट-लॉक उल्लंघन"।
DR डैशबोर्ड: वर्तमान नोड भूमिका, RPO स्कोर (WAL मिनट), PITR विंडो की स्थिति।
सुरक्षा और अनुपालन
क्षेत्राधिकार (ईयू/यूके/सीए/...) द्वारा डेटा अलगाव: कानूनी सीमा के भीतर प्रतिकृति।
फिक्स्ड लॉग (S3 ऑब्जेक्ट लॉक/WORM), नियामक समय सीमा द्वारा प्रतिधारण।
रहस्य: कुंजी रोटेशन, डीआर के लिए दोहरे नियंत्रण।
सभी स्विचओवर और बहाली का ऑडिट ट्रेल।
एंटी-पैटर्न जो डीआर को तोड़ ते हैं
प्रति देश एक PSP/एक स्थिर नेटवर्क - कोई बैकअप रेल नहीं।- एक ही डेटाबेस पर OLTP और OLAP - रिकवरी ब्लॉक लाइव ऑपरेशन।
- पुनरावृत्ति के लिए कोई पहचान - कुंजी - डेबिट/भुगतान युगल नहीं।
- एक नियमित बहाल परीक्षण के बिना बैकअप "श्रोडिंगर बैकअप" हैं।
- WORM/अपरिवर्तनीयता की कमी - अंदरूनी सूत्र/दुर्भावनापूर्ण विलोपन के लिए भेद्यता।
- छोटे टीटीएल और गर्म समापन बिंदुओं के बिना डीएनएस फीलओवर।
- एक ही समय में दो क्षेत्रों में एक एकल खाता लेखक राज्य विभाजन है।
आपातकालीन तैयारी की जांच सूची
वास्तुकला
- सभी महत्वपूर्ण सेवाओं के लिए मल्टी-AZ, प्रलेखित टोपोलॉजी।
- वर्णित भूमिका (सक्रिय-सक्रिय/निष्क्रिय) और बजट के साथ डीआर-क्षेत्र।
आंकड़ा
- पोस्टग्रेस: PITR, स्नैपशॉट, लैग मॉनिटरिंग, नियमित वसूली परीक्षण।
- काफ्का/एनएटीएस: मिररिंग/आर्काइव, रीप्ले प्लान।
- क्लिकहाउस/ओएलएपी: बैच बैकअप, नमूने बहाल करना।
- S3: ऑब्जेक्ट लॉक (WORM), संस्करण, क्रॉस-रीजन।
अनुप्रयोग
- पैसे में आइडेम्पोटेंसी, एपेंड-ओनली लेजर, बैलेंस वर्शनिंग।
- घटनाओं पर ऑटो-फीचर-डिग्रेड (टूर्नामेंट/मिशन ऑफ)।
- क्षेत्र स्विच करने से पहले कैनरी जांच करता है।
टिकट कार्यालय और क्रिप्ट
- प्रति विधि दो प्रदाता और अस्तबल के लिए दो नेटवर्क।
- रूटिंग और स्विच कारण लॉग।
- KYT/AML वृद्धि के साथ नीचा मोड में।
संचालन
- RACI और परिचर फोन के साथ रनबुक।
- मासिक अराजकता के दिन और त्रैमासिक पूर्ण-डीआर अभ्यास।
- संचार टेम्पलेट (समर्थन, भागीदार, नियामक)।
अवलोकन क्षमता
- आरटीओ/आरपीओ डैशबोर्ड, डीबी भूमिका अलर्ट, लैग्स, बोली/वेतन विफलताएं।
- स्विच और पुनर्स्थापना का ऑडिट लॉग।
विश्वसनीयता आईगेमिंग एक "फीलर बटन" नहीं है, लेकिन आदतों की एक प्रणाली है: भौगोलिक अलगाव, पूर्वानुमानित आरटीओ/आरपीओ, पहचान योग्य धन, बहु-रेल नकद डेस्क, अपरिवर्तनीय बैकअप, नियमित अभ्यास और पारदर्शी संचार। यह अनुशासन आपको बही में नुकसान के बिना, "अटक" राउंड के बिना और खिलाड़ियों और नियामकों के विश्वास को मारे बिना विफलताओं का अनुभव करने की अनुमति देता है।