SLA tra operatore e provider: metriche e multe
1) Perché SLA e come gestirlo
SLA registra la qualità prevista del servizio (SLO-obiettivi, finestre di supporto), come stiamo misurando, e ciò che accade in caso di violazioni (servizi-prestiti/multe, escalation, opzioni di uscita). Questo è critico per i clienti: soldi in tempo reale, regolatori, picchi di traffico e dipendenze a più livelli (giochi di portafogli PSP-KYC-CDN/WAF).
Principi:- Misurazione e ambiguità (chi, dove e cosa misura).
- Vicinanza al business (metriche per login/depositi/avvio giochi, non solo CPU).
- Stimolo economico (prestiti di servizio allacciati a danni).
- Gestione (comitato qualità, QBR mensili, PoP-Report).
2) Insieme di metriche per dominio
2. 1 Provider di pagamento (PSP)
Deposit Success Ratio (DSR): numero di depositi/tentativi di successo, per paese/metodo/BIN. L'obiettivo è 99. 0%.
Authorization/Settlement Latency p95: obiettivo 400-600 ms.
Webhook Delivery Delay p95: obiettivo 60 c (T + 60).
Availability (API/Callbacks): ≥ 99. 9 %/mes (escluse le finestre concordate).
2. 2 Provider di videogiochi/aggregatori
TTFS (Time-to-First-Spin) p95: ≤ 800 ms (dalla lobby alla prima schiena).
Game Launch Success: ≥ 99. 5%.
Round Result Callback Success: ≥ 99. 9%, ritardo p95 ≤ 5.
Content Availability: ≥ 99. 95% per catalogo (percentuale di giochi disponibili).
2. 3 provider KYC/AML
Verification API Availability: ≥ 99. 9%.
Median Time-to-Decision: ≤ 60 c (auto), ≤ 15 мин (manual queue).
False Negative/Positive Boundaries: corridoi targati mercati (secondo un campione concordato).
2. 4 Edge/CDN/WAF
TTFB p95: ≤ 200 mc (regionale).
Cache Hit Ratio: ≥ 85% degli assetti statici.
Bot-challenge pass-through: FP ≤ 0. Il 5% sul deposito/deposito.
2. 5 Hosting/cloud/rete
Availability (region/zone): ≥ 99. 95% (zona), RTO 30 min, RPO 5 min per portafoglio.
Ingress/Load Balanner Latency p95: 100 mc nella regione.
3) Formule e misurazione
Regole generali di misurazione
Fuso orario di calcolo: Europa/Kyiv. Il mese del rapporto è di calendario.
L'orologio è considerato UTC in telemetria con conversione in Kyiv per i rapporti.
Sincronizzazione temporale: NTP; Il margine di errore è di 100 ≤.
La fonte di verità è il sintetico dell'operatore + logi server + fornitore. La soluzione temporanea utilizza il peggiore dei due, a meno che non sia dimostrato il contrario.
Esempi di formule
text
Availability = 1 - (Σ Downtime_min) / (Total_min_in_period)
Downtime _ min - minuti in cui> = X% di errori/timeout e/o totale indisponibilità.
La soglia X viene fissata (ad esempio error _ rate 5% o p95 _ latency  SLO x 2).
Deposit Success Ratio = success_count / (success_count + failure_count)
Latency p95 = histogram_quantile(0. 95, rate(latency_bucket[5m]))
TTFS p95 = p95(time(game_open → first_spin_callback))
Webhook Delay p95 = p95(time(webhook_received – event_time))Finestre di manutenzione
Le finestre sono coerenti in 7 giorni, non più di 1 x/mes da 60 min. Finestre di emergenza - 24 ore di notifica.
4) Classificazione degli incidenti e delle reazioni
Comunicazione: stato-pagina/canale, post-mortem per 5 giorni lavorativi.
5) Servizi-prestiti e multe
5. 1 Linea di credito (esempio)
Availability mensile:99. 9%–99. Il 5% ha pagato il 5% della tariffa mensile/commissione del provider.
99. 5%–99. 0% → 10%.
Violazione PSP DSR: ogni 0 completi. 5 p sotto 99. 0% crediti 2%, cap 20%.
Webhook Delay p95> SLO x 2 oltre 60 min totale 5%.
TTFS p95> 800 ms oltre 120 min 5%.
Cronic failure: 3 mesi consecutivi con crediti del 10% per la rescissione anticipata senza multa + aiuto alla migrazione (Fix price/limite orario).
5. 2 Logica economica
I prestiti sono netti (riducono i conti del provider).
I crediti lordi derivanti dal provider (la sua quota), non dalla GGR/NGR in generale.
Monthly cap sui prestiti: solitamente un costo mensile del 100%, eccetto fraud/dati.
5. 3 Earn-back (opzione)
Il provider può "guadagnare" una parte del prestito se il mese prossimo raggiunge un SLO rinforzato (ad esempio Availability "99. 99% intero mese).
6) Modello di valutazione di peso per KPI (per bonus/malus trimestrali)
' = (Peso x Punteggio/5)' bonus/malus © X% alla tariffa.
7) Esempio di resoconto (pesce CSV)
Provider,Month,Availability,DSR,TTFS_p95_ms,Webhook_p95_s,Credits%
PSP-A,2025-09,99. 62%,98. 8%,--,45,12
Games-X,2025-09,99. 97%,--,780,3,0
KYC-Z,2025-09,99. 91%,--,--,--,0
CDN-W,2025-09,99. 99%,--,120,--,08) Regole di esclusione e forza maggiore
Eccezioni: incidenti in terze parti che non fanno parte del perimetro del provider, se provati e documentati, e in presenza di corrette rotte di disponibilità.
Forza Maggiore: solo gli eventi dell'elenco standard (elementi/guerra/blocco regolatorio), con tempestive comunicazioni e tentativi di mitigazione dei danni (DR).
Shared-fault (vino diviso) - I prestiti sono condivisi proporzionalmente al contributo confermato.
9) Controllo qualità e controllo
Accesso dell'operatore a metriche/login/trade (read-only).
Sicurezza-scan trimestrale e resoconto delle vulnerabilità.
Esercitazioni DR: 1 x/trimestre, rapporto RTO/RPO.
I report PSP/giochi recalcitranti sono 0. 5%.
10) Escalation e gestione
Foglio di contatto 24/7 (L1/L2, manager del partner).
WAR-Room con SEC-1.
QBR: analisi trimestrale di KPI, crediti/earn-backs, roadmap.
Piano di miglioramento (CAP) con date e proprietari.
11) Modelli di clausola (sezioni)
SLO e misurazione
Strumenti di credito
Chronic failure & Termination
Dati e webhoop
Finestre pianificate
12) Trappole frequenti e come evitarle
Definizioni sfocate di «indisponibilità» → fissa le soglie di errore/latenza.
Senza contare la geografia, i bersagli per regione, non la media globale.
Niente SLO secondo i dati del →, aggiungi SLA a webhoot/export, altrimenti i rapporti sono in ritardo.
Multe senza cap/earn-back → rendete prevedibile ed equo.
Senza requisiti DR, somministrare RTO/RPO e la frequenza dell'esercitazione.
13) Assegno foglio di implementazione SLA (prod-ready)
- KPI finalizzato per dominio: PSP, giochi, KYC, CDN/WAF, cloud.
- Le fonti di misurazione e le formule sono descritte. confermato il fuso orario e le finestre.
- Finestre di servizio e procedure di notifica concordate.
- La tabella dei prestiti di servizio, cap e cronic-failure clause.
- Procedure di escalation SEC, war-room, post mortem da 5 giorni.
- L'accesso alla telemetria (metriche/logi/roulotte) è stato rilasciato e il test di connessione è stato completato.
- I requisiti DR (RTO/RPO) e la pianificazione degli esercizi sono fissati.
- QBR, scorecard e obiettivi annuali sono coerenti.
- Le eccezioni legali/forza maggiore sono ben descritte.
- Rapporto di prova del mese pilota con il calcolo dei prestiti.
Curriculum
Le SLA operative sono metriche aziendali chiare, regole di misurazione trasparenti, una linea di prestiti elaborata e una gestione della qualità vivente (QBR, CAP, esercitazioni). Fissare KPI per dominio (PSP, giochi, KYC, edge/cloud), concordare su fonti di verità e eccezioni, inserire un modello di peso e un earn-back - e il vostro rapporto con i provider diventerà prevedibile e il rischio per il denaro e il giocatore UX diminuirà notevolmente.
