कैसिनो के लिए विफल, प्रतिकृति और डीआर योजना
1) व्यावसायिक उद्देश्य: आरटीओ/आरपीओ और महत्वपूर्ण प्रवाह
आरटीओ (सेवा कब तक अनुपलब्ध हो सकती है): लॉगिन/दर/जमा - सेकंड/मिनट; रिपोर्ट - घंटे।
RPO (कितना डेटा खो सकता है): बटुआ/लेनदेन - ~ 0-30 सेकंड; टेलीमेट्री - मिनट।
महत्वपूर्ण प्रवाह: लॉगिन, जमा/निकासी, शर्त/निपटान, केवाईसी/एएमएल-कॉलर, पीएसपी/गेम प्रदाता वेबहुक।
2) वास्तुशिल्प दोष सहिष्णुता पैटर्न
सक्रिय-सक्रिय (बहु-क्षेत्र): दोनों क्षेत्र यातायात को कम आरटीओ/आरपीओ, जटिल स्थिरता।
सक्रिय-स्टैंडबाय: ऑपरेशन में एक क्षेत्र, दूसरा गर्म; आसान स्थिति, आरटीओ मिनट।
सेल-आधारित: "सेल" (बाजार/ब्रांड) द्वारा अलगाव, स्थानीय घटनाएं सब कुछ नीचे नहीं लाती हैं।
एज पाई: Anycast CDN/WAF → क्षेत्रीय प्रवेश द्वार → ऐप क्लस्टर → DB/कैश प्रतिकृति के साथ।
3) यातायात प्रबंधन और नेटवर्क नकली
Anycast + CDN/WAF: L3/4/7 uptake, मूल के लिए स्वास्थ्य जांच।
DNS-feilover (कम TTL, बहु-मूल्य), स्वास्थ्य मैट्रिक्स पर ट्रैफिक मैनेजर/GSLB।
तेजी से पथ परिवर्तन के लिए एंटी-डीडीओएस प्रदाता के माध्यम से बीजीपी घोषणा।
स्वास्थ्य जांच (तर्क का उदाहरण):
यदि p95_latency>threshold 5xx_rate>threshold synthetic_login_fail::
नाली (region_A); शिफ्ट (ट्रैफिक-> क्षेत्र _ बी, रैंप = 5min)
4) डेटा: बटुआ, आदेश, दांव
सत्य का स्रोत खाता है: केवल जोड़ें, 'ऑपरेशन _ आईडी' द्वारा पहचान।
सुलह: खाता, पीएसपी और खेल प्रदाताओं के बीच आवधिक सुलह की नौकरियां।
एंटी-डबल: जमा/सॉसेज/भुगतान के लिए पहचान कुंजी; आउटबॉक्स/इनबॉक्स के लिए डीडुप्लिकेशन।
5) डेटाबेस प्रतिकृति - विकल्प और व्यापार
भौतिक तुल्यकालिक (अर्ध-सिंक): न्यूनतम आरपीओ, देरी का जोखिम - बिंदुवार (बटुआ) लागू करें।
अतुल्यकालिक: उच्च प्रदर्शन/सादगी, आरपीओ सेकंड-मिनट - गेम मेटाडेटा, संदर्भ पुस्तकों के लिए।
तार्किक (सीडीसी → दूसरे क्षेत्र में स्ट्रीम): लचीली चयनात्मकता, क्रॉस-इंजन और एनालिटिक्स के लिए सुविधाजनक।
कैश (Redis/Memcached): सत्य के स्रोत के रूप में नहीं; प्रतिकृति/स्नैपशॉट, गर्म शुरू होता है।
PITR: ऑफसाइट स्टोरेज, रिकवरी विंडो ≥ 7-30 दिनों के लिए निरंतर लॉग (WAL/redo)।
6) स्थिरता और सुलह पैटर्न
सागा + आउटबॉक्स: चरणों की एक श्रृंखला के रूप में व्यापार लेनदेन, डेटाबेस को लिखने के साथ परमाणु रूप से घटनाओं को प्रकाशित करना।
वास्तव में-एक बार "अर्थ में": संचालन की पहचान, संतुलन संस्करणों का नियंत्रण (आशावादी लॉकिंग)।
गैर-कुंजी प्रवाह (नेता बोर्ड, एनालिटिक्स) में अंतिम स्थिरता; पैसे के लिए मजबूत।
7) घटक और उनका फीलओवर
एपीआई/बैकएण्ड
स्टेटल कंटेनर, ऑटोस्केल, ब्लू-ग्रीन/कैनरी; भंडारण के माध्यम से कॉन्फ़िग (संस्करण के साथ)।
कतारें/धाराएँ
कोरम क्लस्टर्स (N = 3/5), क्रॉस-AZ प्रतिकृति; फिर से नीतियां और डीएलटी कतारें।
बटुआ डीबी
क्षेत्र ए में प्रिमारी, ए (अन्य AZ) में सिंक प्रतिकृति, क्षेत्र B में अतुल्यकालिक; विभाजन-मस्तिष्क के साथ स्वचालित प्रचार निषिद्ध है - केवल एक चेकलिस्ट के साथ मैनुअल/स्क्रिप्
फ़ाइलें/सीयूएस कलाकृतियाँ
केएमएस में वर्शनिंग, क्रॉस-रीजनल प्रतिकृति/सीआरआर के साथ ऑब्जेक्ट स्टोरेज।
वेबसॉकेट/रियल-टाइम
कुंजियों (टेबल/गेम/मार्केट), चिपचिपा-रूटिंग द्वारा शार्डिंग; एक फ़ीलर के साथ - साथ फिर से जुड़ ने के लिए टोकन के साथ।
8) भुगतान और खेल प्रदाता: सत्य के कई स्रोत
PSP-feilover: प्रत्येक विधि (कार्ड, पर्स, क्रिप्टो) के लिए कम से कम 2 प्रदाता।
एसएलए/मूल्य/बैंलिस्ट बिन द्वारा प्रतिशत अनुमार्गण; स्वचालित सर्किट ब्रेकर द्वारा अपमानित पीएसपी की निष्क्रियता।
खेल प्रदाता: बैकअप चैनल/एएसएन अनुमति-सूची, क्षेत्रों के लिए व्यक्तिगत कुंजी, टाइमआउट का अलगाव।
9) वेबहूक और सॉसेज: स्थायी स्वागत और प्रजनन
इनबॉक्स-पैटर्न: हम वेबहुक को स्वीकार करते हैं - हस्ताक्षर/NMAS की जाँच करें - अपरिवर्तनीय-इनबॉक्स में लिखें - कार्यकर्ता को पहचानने की प्रक्रिया।
प्रदाताओं की पुनरावृत्ति: 'घटना _ id '/' हस्ताक्षर' द्वारा बैकऑफ + डीडअप।
डीआर में: ऑर्डर कंट्रोल (txn → सेटलमेंट) के साथ इनबॉक्स से रीप्ले।
10) बैकअप: 3-2-1 रणनीति और वसूली की जाँच
3 प्रतियां/2 मीडिया/1 ऑफसाइट (और महत्वपूर्ण पत्रिकाओं के लिए 1 ऑफ़ लाइन/WORM)।
शेड्यूल: दैनिक स्नैपशॉट + स्थायी पत्रिकाएं; "डार्क" स्टैंड के लिए साप्ताहिक परीक्षण-बहाल।
रिकवरी निर्देशिका: "टी- the के समय अपने बटुए को कैसे बढ़ाएं।"
11) डीआर योजना: भूमिकाएं, परिदृश्य, संचार
Роли: हादसा कमांडर, कॉम्स, डीबी लीड, ऐप लीड, पेमेंट/गेम पीएम, एसआरई ऑनकॉल।
चैनल: युद्ध-कक्ष, स्थिति पृष्ठ, समर्थन/भागीदारों/सहयोगियों के लिए संदेश टेम्पलेट।
परिदृश्य (न्यूनतम):- AZ का नुकसान, क्षेत्र का नुकसान, PSP अनुपलब्धता, डेटाबेस क्लस्टर ड्रॉप, गेम प्रदाता गिरावट, कुंजी रिसाव, बड़े पैमाने पर 5xx।
12) डीआर परिदृश्य मैट्रिक्स का उदाहरण
13) रनबुक और ऑटोमेशन
"डीआर-कटओवर" बटन: सत्यापन के साथ चरणों का अनुक्रम (फ्रीज लिखता है गर्म कैश रैंप ट्रैफ़िक को बढ़ावा देना)।
इंटीग्रिटी चेक स्क्रिप्ट: लेजर/वॉलेट राशि का सामंजस्य, संतुलन स्थिरता।
फ़ीचर-फ्लैग: एक दुर्घटना के दौरान जल्दी से रिपोर्ट/निर्यात/भारी डैशबोर्ड अक्षम करें।
14) एक फीलओवर के लिए अवलोकन
एसएलओ मैट्रिक्स ट्रिगर के रूप में: लॉगिन, जमा, शर्त, गेम लॉन्च।
Технические: प्रतिकृति-अंतराल, WAL-शिपिंग, कतार-लैग, 5xx, p95, SYN बैकलॉग, WebSocket डिस्कनेक्ट।
अन्य क्षेत्रों से सिंथेटिक परिदृश्य: लॉगिन/जमा/शर्त हर मिनट।
एंड-टू-एंड ट्रेस, 'क्षेत्र', 'psp', 'game _ provider' टैग.
15) अराजकता/डीआर अभ्यास
गेमडे त्रैमासिक: AZ का विघटन, PSP का क्षरण, डेटाबेस नोड का "नुकसान", कतार बंद।
पूर्वव्यापी: निर्णय का समय, लापता अलर्ट, शोर, अड़ चनें।
आरटीओ/आरपीओ को समायोजित करना और तथ्यों के आधार पर स्वचालन, "संवेदनाएं" नहीं।
16) सुरक्षा और अनुपालन
KMS/HSM (क्रॉस-रीजनल), रोटेशन और डुअल-कंट्रोल में कुंजी/रहस्य।
ऑडिट और लेनदेन लॉग के लिए WORM/प्रतिरक्षा।- एसएलए/डीआर प्रतिबद्धताओं के लिए डीपीए/पीएसपी/प्रदाता अनुबंध और 24 × 7 संपर्क बिंदु।
17) फीलोवर न्यूनतम नीति का उदाहरण (स्यूडोकोड)
हादसे पर (प्रकार = "क्षेत्र _ DOWN"):
freeze_non_critical_writes ()
promote_db (क्षेत्र = बी)
verify_ledger_consistency ()
warm_caches (क्षेत्र = बी)
route_traffic (क्षेत्र = बी, रैंप = 10%)
में कदम के लिए [25%, 50%, 100%]:
यदि SLO_green (): रैंप (चरण) और रोलबैक ()
announce_statuspage ()
18) प्रोड-रेडी चेकलिस्ट
- प्रति प्रवाह परिभाषित आरटीओ/आरपीओ; व्यापार द्वारा स्वीकार
- मल्टी-एजेड न्यूनतम; बटुआ, लॉगिन और भुगतान के लिए बहु-क्षेत्र।
- लेजर + आइडेम्पोटेंसी (कुंजी) + आउटबॉक्स/इनबॉक्स; एक कार्यक्रम पर सुलह।
- डेटाबेस प्रतिकृति: स्थानीय रूप से सिंक करें, DR में async; PITR सक्षम, पुनर्स्थापित चेक।
- प्रति विधि दो पीएसपी, रूटिंग नीति और परीक्षण कुंजी; खेल प्रदाता विकल्प हैं।
- DNS/GSLB/Anycast, स्वास्थ्य जांच और सिंथेटिक्स, कम TTL।
- रनबुक और डीआर-कटओवर बटन, गिरावट के लिए सुविधा-झंडे।
- SLO/अलर्ट/ट्रेसिंग; डीआर स्थिति पैनल।
- त्रैमासिक डीआर अभ्यास + रेट्रो; अद्यतन संपर्क 24 × 7।
सारांश फिर से शुरू करें
एक विश्वसनीय iGaming प्लेटफ़ॉर्म एक मौद्रिक सर्किट के आसपास बनाया गया है: पहचान के साथ पोस्टिंग की एक पत्रिका, एक पूर्वानुमानित फीलर, सत्यापित प्रतिकृति और नियमित DR अभ्यास। सिस्टम को कोशिकाओं और क्षेत्रों में विभाजित करें, कटओवर स्वचालित करें, दो पीएसपी और अतिरिक्त गेम प्रदाताओं को रखें, एसएलओ और बही अखंडता की निगरानी करें - और यहां तक कि एक बड़ी दुर्घटना विश्वास और पैसा खोए बिना एक प्रबंधनीय घटना बन जाएगी।