訪談大型遊戲控股公司CTO
擁有眾多工作室和流派的遊戲控股不僅是內容,而且是平臺:引擎,輕量級操作,網絡,數據堆棧,DevEx和安全性。我們與CTO(廣義訪談)討論了哪些解決方案真正推動了指標,如何在增長中保持快速以及為什麼「沒有文化的技術」不會起飛。
1)戰略: 使技術具有競爭優勢的原因
問題:你的2-3年優先事項是什麼?
CTO:三個軸:1.交付平臺(build →測試→遙測→發布),時間從commit到production <2小時直播。
2.輕量級服務的可靠性:關鍵路徑的SLO(登錄,匹配制作,支付,庫存)和「優雅退化」。
3.數據和AI:在線得分(任務/比賽選擇),離線謂詞(churn/LTV/毒性)和嚴格的監護人。
2)體系結構:巨石,微服務或「模塊化巨石」?
問:你認為什麼樣式對遊戲服務是合理的?
CTO:模塊化內核整體(帳戶,庫存,經濟性)+外圍微服務(匹配制造,分析,支付適配器,通知)。這減少了網絡「跨度」,簡化了事務並允許團隊獨立開發「邊緣」功能。頂部是ficheflagi和金絲雀推出。
3)網絡代碼和比賽制作
問:如何保持低延遲和公平競爭?
CTO:
協議:實時的UDP/QUIC,元數據的gRPC/HTTP。
預測和回滾(client-side prediction+server reconciliation)反對「傳送」。
按區域/等級排列,RTT穩定性優先於「完美」平衡。
比賽制作:Elo/TrueSkill混合體+預期延遲+角色/位置。
用於NAT、抗DDoS和加密的邊緣中繼節點。
Antichit:客戶端完整性信號,行為模型,服務器驗證。
4)Live Operation平臺
Q: 在你的引擎蓋下,真人有什麼?
CTO:
活動/季節日歷,任務,店面和商店-由預覽編排器和A/B控制。
帶有獎勵預算和「帽子」的經濟服務與通貨膨脹。
「溫暖」的方案遷移和熱播遊戲規則。
實驗平臺:ficheflagi,土匪,geo/role-split,統計能力和guardrails(SLO,毒性,付款)。
5)數據堆棧和ML/AI
問:數據是如何排列的?
CTO:
事件流(OpenTelemetry)→在湖/倉庫中流式傳輸,用於在線計分。
用於產品和支持的實時店面(≤1 -5分鐘)。
ML:churn/uplift/LTV,動態復雜性(DDA),聊天毒性,付款對位,任務/內容建議。
生成:本地化,對制作人和QA的協助;嚴格的許可證和水印,知識的RAG機器人。
MLOps:實驗跟蹤,幻想/目標漂移,金絲雀模特,可解釋(SHAP)。
6)可靠性和SRE
問:如何衡量服務的健康狀況?
CTO:
SLO走向「客戶→比賽→結果→庫存→付款」;預算中的錯誤。
跟蹤鏈(分布式跟蹤)用於查找回歸。
「優雅降解」:在高峰時禁用「昂貴」的菲奇(重復,化妝品);自動減少抽動。
GameDays和chaos測試,事件訓練。
儲備:多元化,僅讀取庫存模式,排隊進行系統外操作。
7)安全,隱私,古怪
問:主要風險在哪裏?
CTO:
鑰匙僅通過KMS/HSM,保密-輪換。
RBAC/ABAC和管理訪問日誌,法案文物的簽名。
Antichit:客戶端完整性(checksums,內存不信任),服務器結果仲裁性,行為「向量-信號」。
私有性:盡量減少PII,保留政策數據,在自動措施下有權解釋。
合規性:GDPR/本地,事件報告和DPIA。
8) FinOps和效率
問:如何在不傷害的情況下降低平臺成本?
CTO:
通過SLO而不是粗糙的CPU進行自動縮放。
用於稀有內容的寒冷區域,用於遙測的「近線」。
按申請劃分的GPU池,網絡成本分析。
Cost to serve per DAU/machtmeich度量;發行版基準。
「有預算的建築」:任何菲奇都會因潛伏期和成本的增長而咆哮。
9) DevEx: 團隊速度
問:如何讓開發人員快速安靜?
CTO:
服務模板,單一引導程序,「黃金路徑」。
內核的Monorepo,外圍的polyrepo;API/SDK編碼。
集成環境「像質子」(數據雙)。
CI/CD帶有廣告牌緩存,平臺測試矩陣,遊戲機器人。
給開發人員的數據是通過合成套件和混淆。
10)文化與組織模式
問:如何連接平臺和工作室?
CTO:平臺團隊(識別,經濟學,庫存,比賽制作,遙測,ML,DevEx)。上方是技術委員會(體系結構,安全性,數據)。工作室在內容上具有自主性,但使用「黃金路徑」。每個季度都是具有通用KPI的roadmap評論。
11)訂閱、付款和經濟保護
問:售票處和商店有什麼意義?
CTO:
智能支付路由,透明的ETA/傭金,在可能的情況下掛線。
Antifrod:device+行為+鏈接圖(帳戶-devys-payer)。
獎項的經濟學是「kaps」,沒有P2W角度,整個季節的動態成本。
內置RG模式(暫停,限制,現實支票)。
12)內容交付和引擎
Q: Unity/Unreal/自己的引擎-如何選擇?
CTO:使用混合動力:用於快速娛樂的商業引擎;用於網絡代碼、經濟學和遙測的本機模塊。平臺的通用SDK:庫存,任務,商店,分析,古董和付款-因此工作室不會發明自行車。
13)決定的度量
遊戲:D1/D7/D30,stickiness(DAU/MAU),median session length,「時間到核心樂趣」。
業務:payer conversion,ARPPU,LTV/CAC,ROI活動。
可靠性:aptime,p50/p95/p99在關鍵路徑上,比賽時間。
發行質量:更改失敗率,領先時間,MTTR。
安全:MTTD/MTTR,容器份額,「健康」秘密。
成本服務:$/DAU,$/匹配,$/GB遙測。
14)典型錯誤和反模式
微服務「為了時尚」→網絡風暴和復雜的交易。
發布後而不是發布前的遙測-事件中的盲區。
沒有護欄的實驗是SLO倦怠的「成功」。
僅在客戶端Antichit-對客戶的零信任是強制性的。
沒有許可證和控制的Gen-AI是法律和品牌風險。
沒有「優雅降解」-高峰時級聯下降。
15)180天路線圖(用於保持增長)
Days 1-30-診斷和SLO
關鍵路徑目錄,SLO/SLA,端到端跟蹤。
DevEx/CI/CD差距分析,秘密清單。
Days 31-60-幻想和實驗平臺
Ficheflagi,金絲雀發行,帶有guardrails的A/B基礎設施。
單個SDK:帳戶,庫存,經濟學,遙測。
Days 61-90-數據和ML
Fichestor,實時店面,基本的churn/uplift模型。
隱私和可解釋性政策,知識的RAG機器人。
Days 91-120-可靠性和安全
GameDays/chaos,「優雅降解」,NOC運行手冊。
KMS/輪換,法案簽名,對數服務器層。
Days 121-180-FinOps和規模
根據SLO,GPU池計算成本到服務度量。
實時操作內容日歷,DDA,本地化展示。
16)支票單
SRE/可靠性
- SLO登錄/比賽/庫存/付款,錯誤預算。
- 單一系統中的Tracing+logi+度量。
- 光滑降解和「紅色按鈕」幻燈片。
- Runbooks, pager值班,GameDays。
安全/Antichit
- KMS/HSM,秘密輪換,文物簽名。
- RBAC/ABAC,管理訪問日誌。
- 遊戲的服務器驗證,行為模型。
- DPIA/GDPR,PII最小化,事件報告。
數據/ML
- 活動流媒體,fichestor, real-time店面。
- churn/uplift/DDA模型,漂移監測。
- 可解釋性、數據集審核、內容許可。
- 實驗學科和guardrails。
DevEx / CI-CD
- 服務模式,「黃金路徑」。
- 緩存版本、測試矩陣、自動版本。
- 合成數據,混淆。
- Preview星期三,playtest-bots。
經濟/卡薩
- UI的ETA/傭金支付管弦樂隊。
- Antifrod:devays+鏈接圖。
- 獎項,缺乏P2W角度。
- RG模式:限制,暫停,真人秀支票。
遊戲中的技術領導力是穩定的交付節奏和可靠的輕量級服務,並輔以數據和負責任的設計。正確的體系結構(模塊化內核+外圍服務),強大的DevEx,由SLO衡量,有意義的AI和嚴格的安全性將復雜的控股轉變為可控的增長機器,工作室可以在其中快速制作內容,並且平臺-精益和可預測地將其帶給數百萬玩家。