Büyük Oyun Holding CTO Röportajı
Birçok stüdyo ve türe sahip bir oyun sadece içerik değil, aynı zamanda bir platformdur: motorlar, canlı işlemler, ağ, veri yığını, DevEx ve güvenlik. Hangi kararların gerçekten metrikleri yönlendirdiği, büyümeyle nasıl hızlı kalınacağı ve "kültürsüz teknolojinin" neden işe yaramadığı hakkında CTO (genelleştirilmiş röportaj) ile konuştuk.
1) Strateji: Teknolojiyi rekabet avantajı yapan şey
Soru: 2-3 yıllık öncelikleriniz?
CTO: Üç eksen:1. Teslim platformu (inşa etmek, test etmek, serbest bırakmak, telemetri) ile zamandan üretime kadar <2 saat canlı özellik için.
2. Canlı hizmetlerin güvenilirliği: Kritik yolların SLO'su (giriş, eşleştirme, ödemeler, envanter) ve "zarif bozulma".
3. Veri ve AI: çevrimiçi puanlama (misyon/maç seçimi), çevrimdışı tahmin (churn/LTV/toksisite) ve sıkı korkuluklar.
2) Mimari: monolit, mikro hizmetler veya "modüler monolit"?
Soru: Oyun hizmetleri için hangi tarzın makul olduğunu düşünüyorsunuz?
CTO: Modüler çekirdek monolit (hesap, envanter, kahya) + çevrede mikro hizmetler (eşleştirme, analitik, ödeme adaptörleri, bildirimler). Bu, ağ "haçlarını" azaltır, işlemleri basitleştirir ve ekiplerin bağımsız olarak "kenar" işlevlerini geliştirmelerini sağlar. Üstte ficheflags ve kanarya ruloları var.
3) Ağ kodu ve eşleştirme
Soru: Düşük gecikme ve adil oyun nasıl korunur?
CTO:- Protokoller: Gerçek zamanlı UDP/QUIC, meta veriler için gRPC/HTTP.
- "Işınlanma'ya karşı istemci tarafı tahmini + sunucu mutabakatı.
- Bölgeye/rütbeye göre ayırma, RTT istikrarını "mükemmel" dengeye göre önceliklendirme.
- Eşleştirme: Elo/TrueSkill hibrid + beklenen gecikme + rol/pozisyon.
- NAT, anti-DDoS ve şifreleme için kenar röle düğümleri.
- Anti-hile: istemci bütünlüğü sinyalleri, davranış modelleri, sunucu doğrulaması.
4) Canlı operasyon platformu
S: Kaput canlı operasyonlarınızın altında ne var?
CTO:- Etkinlik/sezon takvimi, görevler, vitrinler ve mağazalar - önizleme ve A/B ile orkestradan yönetilir.
- Ödül bütçeleri ve enflasyonla mücadele sınırları ile ekonomi hizmeti.
- Şemaların "sıcak" göçleri ve hot-reload oyun kuralları.
- Deneysel platform: phicheflags, haydutlar, geo/role-split, istatistiksel güç ve korkuluklar (SLO, toksisite, ödemeler).
5) Veri yığını ve ML/AI
S: Veriler nasıl çalışır?
CTO:- Olay akışı (OpenTelemetry) - göl/depoya akış, on-line puanlama için fichestor.
- Ürünler ve destek için gerçek zamanlı vitrinler (≤1 -5 dakika).
- ML: çalkalama/yükseltme/LTV, dinamik karmaşıklık (DDA), sohbet toksisitesi, dolandırıcılıkla mücadele ödemeleri, görev/içerik önerileri.
- Üretimsel: yerelleştirme, üreticilere yardımcı olma ve QA; Sıkı lisanslar ve filigranlar, bilgi için RAG botları.
- MLOps: izleme deneyleri, özellik/hedef sürüklenme, kanarya dağıtım modelleri, açıklanabilirlik (SHAP).
6) Güvenilirlik ve SRE
Soru: Hizmetlerin sağlığını nasıl ölçüyorsunuz?
CTO:- Yoldaki SLO "istemci - maç - sonuç - envanter - ödeme"; bütçe gibi hatalar.
- Regresyonları bulmak için dağıtılmış izleme.
- "Zarif bozulma": zirvelerde "pahalı" özellikleri (tekrarlar, kozmetikler) kapatın; Mümkün olduğunda otomatik tik azaltma.
- GameDays ve kaos testleri, olay eğitimi.
- Rezervler: Çok bölgeli, salt okunur envanter modu, sistem dışı işlemler için kuyruklar.
7) Güvenlik, gizlilik, anti-hile
S: Ana riskler nerede?
CTO:- Anahtarlar sadece KMS/HSM aracılığıyla, sırlar - rotasyonlu.
- RBAC/ABAC ve yönetici erişim günlüğü, yapı eserlerinin imzası.
- Anti-hile: istemci bütünlüğü (sağlama toplamı, bellek güvensizliği), sonucun sunucu arbitrajı, davranışsal "vektör sinyalleri".
- Gizlilik: PII minimizasyonu, politika verilerinin saklanması, otomatik önlemler için açıklama hakkı.
- Uyumluluk: GDPR/yerel, olay raporlama ve DPIA.
8) FinOps ve etkinlik
Soru: Bir platformun maliyetini zarar vermeden nasıl düşürürsünüz?
CTO:- SLO tarafından otomatik ölçeklendirme, kaba CPU'lar tarafından değil.
- Nadir içerik için soğuk bölgeler, telemetri için "nearline".
- GPU havuzları, ağ maliyeti profili talep ediyor.
- DAU/mast metriği başına servis maliyeti; Serbest bırakma kriterleri.
- "Bütçeli mimari": herhangi bir özellik gecikme ve maliyetteki artışla ilgili bir incelemeye gider.
9) DevEx: ekiplerin hızı
S: Geliştiricileri nasıl hızlı ve sakin yapabilirim?
CTO:- Servis şablonları, tek önyükleme, altın yollar.
- Çekirdek için monorepo, çevrede polirepo; API/SDK kodlaması.
- Entegrasyon ortamları "prod gibi" (ikiz veri).
- Yapı önbellekleri, platform test matrisleri, playtest botları ile CI/CD.
- Geliştiricilere veri - sentetik kümeler ve şaşırtma yoluyla.
10) Kültür ve org modeli
S: Platformu ve stüdyoları nasıl bağlarsınız?
CTO: Platform takımları (tanımlama, ekonomi, envanter, eşleştirme, telemetri, ML, DevEx). Bunların üstünde teknik konsey (mimari, güvenlik, veri) vardır. Stüdyolar içerik olarak bağımsızdır, ancak "altın yolları" kullanırlar. Her çeyrek, ortak KPI'larla bir yol haritası incelemesidir.
11) Abonelikler, ödemeler ve ekonominin korunması
Soru: Ödeme ve mağazada önemli olan nedir?
CTO:- Akıllı ödeme yönlendirmesi, şeffaf ETA/komisyonlar, mümkünse sabit kablolar.
- Antifraud: cihaz + davranış + bağlantı grafiği (hesap-cihaz-ödeme).
- Ödüllerin ekonomisi "caps'ile, P2W açılar olmadan, mevsimler boyunca dinamik değerdedir.
- Yerleşik RG modelleri (duraklamalar, sınırlar, gerçeklik kontrolleri).
12) İçerik dağıtımı ve motorları
Soru: Birlik/Unreal/kendi motoru - nasıl seçilir?
CTO: Bir hibrit kullanıyoruz: hızlı Zaman-Eğlence için ticari bir motor; Ağ kodu, ekonomi ve telemetri için yerel modüller. Ortak platform SDK: envanter, görevler, mağaza, analitik, anti-hile, ödemeler - böylece stüdyolar tekerleği yeniden icat etmez.
13) Karar veren metrikler
Oyun: D1/D7/D30, yapışkanlık (DAU/MAU), medyan oturum uzunluğu, "çekirdek eğlence zamanı".
İş: ödeyen dönüşüm, ARPPU, LTV/CAC, ROI etkinlikleri.
Güvenilirlik: çalışma süresi, kritik yollarda p50/p95/p99, eşleşme süresi.
Sürümlerin kalitesi: değişim başarısızlık oranı, teslim süresi, MTTR.
Güvenlik: MTTD/MTTR, oran muhafaza,'sağlık "sırları.
Servis maliyeti: $/DAU, $/maç, $/gigabayt telemetri.
14) Tipik hatalar ve anti-desenler
"Moda uğruna" mikro hizmetler - ağ fırtınaları ve karmaşık işlemler.
Serbest bırakıldıktan sonra telemetri, daha önce değil - olaylarda kör noktalar.
Korkuluksuz deneyler - SLO'yu yakma pahasına "başarı".
Yalnızca müşteriye anti-hile - müşteriye sıfır güven zorunludur.
Lisanslar ve kontroller olmadan Gene-AI - yasal ve marka riskleri.
"Zarif bozulma" yok - basamaklı zirvelerde düşüyor.
15) 180 günlük yol haritası (büyüme tutma için)
Gün 1-30 - Tanı ve SLO
Kritik yol dizini, SLO/SLA, uçtan uca izleme.
Gap analizi DevEx/CI/CD, sırların envanteri.
Gün 31-60 - Platform özellikleri ve deneyler
Ficheflags, kanarya bültenleri, korkuluklu A/B altyapısı.
Tek SDK: hesap, envanter, ekonomi, telemetri.
Gün 61-90 - Veri ve ML
Fichestor, gerçek zamanlı vitrinler, temel çalkalama/yükseltme modelleri.
Gizlilik ve açıklanabilirlik politikaları, bilgi RAG bot.
Gün 91-120 - Güvenilirlik ve Güvenlik
GameDays/kaos, "zarif bozulma", NOC runbooks.
KMS/döndürme, imza oluşturma, hile önleyici sunucu katmanı.
Gün 121-180 - FinOps ve ölçek
Hizmet maliyeti metrikleri, SLO, GPU havuzlarına göre otomatik ölçeklendirme.
Live-ops içerik takvimi, DDA, yerelleştirme vitrinleri.
16) Kontrol listeleri
SRE/Güvenilirlik
- Giriş/eşleşme/envanter/ödeme için SLO, hata bütçeleri.
- İzleme + günlükler + metrikler tek bir sistemde.
- Zarif bozunma ve kırmızı düğme özelliği.
- Runbooks, çağrı cihazı görevi, GameDays.
Güvenlik/Antichitis
- KMS/HSM, gizli rotasyon, eser imzası.
- RBAC/ABAC Yönetici Erişim Günlüğü.
- Sunucu tabanlı oyun doğrulama, davranış modelleri.
- DPIA/GDPR, PII minimizasyonu, olay raporlama.
Veri/ML
- Olay akışı, fichestor, gerçek zamanlı vitrinler.
- çalkalama/yükseltme/DDA modelleri, sürüklenme izleme.
- Açıklanabilirlik, veri kümesi denetimi, içerik lisansları.
- Deneysel disiplin ve korkuluklar.
DevEx/CI-CD
- Hizmet şablonları, altın yollar.
- Önbelleğe alınmış yapılar, test matrisleri, otomatik sürümler.
- Sentetik veri, şaşırtma.
- Önizleme ortamları, playtest botları.
Ekonomi/bilet ofisi
- Ödeme Orkestratörü, UI'de ETA/Ücretler.
- Antifraud: cihaz + bağlantı grafiği.
- Ödül Caps, P2W açıları eksikliği.
- RG kalıpları: sınırlar, duraklamalar, gerçeklik kontrolleri.
Oyunlarda teknolojik liderlik, veriler ve sorumlu tasarımla desteklenen istikrarlı bir teslimat ritmi ve güvenilir canlı hizmetlerdir. Doğru mimari (modüler çekirdek + çevre hizmetleri), SLO ile ölçülen güçlü DevEx, anlamlı AI ve sıkı güvenlik, stüdyoların hızla içerik oluşturduğu ve platformun dikkatli ve tahmin edilebilir bir şekilde milyonlarca oyuncuya getirdiği yönetilen bir büyüme makinesine dönüşüyor.