AI ալգորիթմներ խաղերի բարդությունը հարմարեցնելու համար
Ե՞ րբ և ինչ հարմարեցնել
Տեմպը և տեմպը 'արագությունը, իրադարձությունների հաճախությունը, հակառակորդների թիվը, ալիքների թայմինգները։
Մարտավարական բարդություն 'բոտերի ճշգրտությունը, նրանց մարտավարությունը, ճանապարհի «կարողությունը»։- Պազլներն ու հուշումները 'ժամանակի պատուհանը, քայլերի քանակը, ակնարկների առկայությունը։
- Ռեսուրսները և տնտեսությունը 'լութ, հիլ, չեկպոինտա, թայմ-աուտներ։
- Ինտերֆեյսը և հասանելիությունը 'ավտո-տեսարան, հակադրություն, մեծ տառատեսակներ, «ռեժիմ առանց անջատման»։
- Խաղային խաղեր. Դուք չեք կարող փոխել RTP/հավանականությունը/paytables/նիշերի քաշը, հարմարվում են միայն ներկայացմանը, անիմացիայի տեմպին, սովորեցնելուն, բովանդակության վիտրիններին և RG-noby- ին։
Ազդանշաններ. Ինչի՞ ց է AI-ն հասկանում «ցավի մակարդակը»
Առցանց ազդանշաններ
Անցման ժամանակը, գետերի, մահացությունների, վնասների/չափերի քանակը, ճշգրտությունը։- Վարքագծային փամփուշտներ 'կտրուկ «քվիտներ», դադարներ, թեթև ռեժիմով անցում։
- Կենսաչափական/պարալինգվիստիկա (եթե խաղացողը հստակ թույլ տվեց) 'խոսքի/շնչառության տեմպը, միկրոպաուզացումը։
- Սարքի/ցանցի հեռուստաչափությունը 'fps-drops, բայերը նպաստում են ռուսական երկաթի բարդությանը։
Offline/պրոֆիլը
Հաջողությունների պատմությունը ժանրերում/ռեժիմներում, որոնք սովորեցնում են մակարդակները, տրամաչափական թեստի արդյունքները։
Հասանելիության բարձրացումը (հակադրություն, TFC, auto-տեսարան) - հարգել ընտրությունը լռելյայն։
Մոդելներ և ալգորիթմներ
1) Հետադարձ կապի վերահսկիչները (արագ սկիզբը)
PID վերահսկիչը 'նպատակը միջին «լարման մակարդակն» է (օրինակ, հաջողության 60-70 տոկոսը)։
Շվեյցարիա: սխալը = նպատակն է իրական հաջողությունը (կամ TTK/retire-rate)։
Ելքը 'շարժիչի փոփոխության քայլ (արագությունը, AI ճշգրտությունը)։- Պլյուսներ ՝ պարզություն, կանխատեսելիություն։ Մինուսներ 'անհրաժեշտ է ձեռքի թյունինգ, տեղական օպտիմա։
2) Համատեքստային ավազակները (հարմարեցումը «այստեղ և հիմա»)
LinUCB/Thompson Sampling-ը համատեքստով 'skille, սարք, fps, տիպի շարժիչ։- Ընտրում են գործողություն (բարդությունների մի շարք), ավելացնելով «վարձատրությունը» (պահել/flow-score), հաշվի առնելով անորոշությունը։
- Պլյուսներ 'ձևավորում են on.ru ուսուցում առանց ծանր ենթակառուցվածքի, արագ փոխակերպում։
3) Բայեսովի հմտության մոդելները
Windows Skill/Glicko-ը նման է խաղացողի վարկանիշի և «մրցույթի վարկանիշի»։- Նրանք կարոտում են հմտությունների կարճ և երկար դինամիկան, տալիս վստահելի ընդմիջումներ։
- Օգտակար են խաղաթաղանթի և բարդության պլանավորման համար 'հասնելով մակարդակի։
4) Հաջորդականություն և կանխատեսում (RNN/Transformer)
Կանխատեսում են մրգերի/քվիտի հավանականությունը N րոպեի հորիզոնում։- Տես ՝ փորձերի հաջորդականություններ, վնասներ, սխալներ, UI միկրովայրկյաններ։
- Ելքը '«գերտաքացման ռիսկը» փափուկ միջամտություն է (հուշում, չեկպոինտ, դադար)։
5) RL-ռեժիմը (մեծ երկարությունների համար)
Reinforcant Learning-ը որպես «բովանդակության ռեժիմը», գործակալը ընտրում է ալիքների/պազզլների կազմաձևը։
Վարձատրություն ՝ ժամանակը հոսքի մեջ, հոսանքների նվազումը, պահպանումը, հարգանքը RG/հասանելիության նկատմամբ։
Մենք պահանջում ենք սիմուլյատորներ/սինթետիկ խաղացողներ և կոշտ զգեստապահարաններ, որպեսզի չպատրաստենք մանիպուլյացիա։
Քաղաքականություններ և հանդերձանքներ (լռելյայն էթիկա)
Բոտերի ճշգրտության վրա, արագությունը, թշնամիների քանակը։- Փոփոխության սահունությունը 'ոչ ավելի քան X տոկոսը Y վայրկյանում; խուսափել «ճոճանակներից»։
- Թափանցիկությունն ու վերահսկողությունը 'խաղացողը կարող է շտկել բարդությունը, անջատել DDA-ն, ներառել «story mode»։
- Հասանելիություն> chelenge: Հասանելիության տարբերակները միշտ ավելի ուժեղ են, քան ավտոմատ բարդությունը։
- Խաղային խաղեր 'շանսերի հարմարեցում/2019; միայն ուսուցիչներ, տեմպեր և RG միջամտություններ։
- Anti էքսպլոյթ 'պաշտպանություն «sandbagging» -ից (արհեստական թերագնահատումը սկիլայի համար բոնուսների համար)։
UX-patterns «խնամքի» հարմարեցում
Micropodage-ից հետո. <<Ուղարկեք հասցեները ակնարկի համար (առանց տուգանքների)>>։
Փափուկ դադար. <<Թվում է, որ սեգմենտը ավելի բարդ է, քան սովորականը։ Պարզեցնել թայմինգները։ [Այո/Ոչ]"։
Կալիբուլյատիվ մակարդակը '1-2 րոպե պրակտիկայի արագ սահմանումով։
Բարդության վերահսկման կենտրոն 'տեսանելի է ներկա մակարդակի հետ, փոփոխության պատմություն, «վերադարձնել»։
Հաղորդակցություն առանց ստիգմայի 'խուսափել «Դուք չափազանց թույլ եք»։ Ավելի լավ է ․ «Եկեք հարմարավետ տեմպեր վերցնենք»։
Հաջողության մետրերը (KPI)
Flow/հաջողությունը 'K փորձարկումների համար հատվածների անցման միջին տոկոսը։ միջին ժամանակը «մինի հաղթանակների» միջև։
Retray/քվիտ 'rage-quit նվազեցում, կիսարարների նվազում շեմից բարձր։- Պահպանումը և նստաշրջանները ՝ DAU/WAU, ընդմիջումներով ժամանակ, վերադարձնելով բարդ հատվածներին։
- Հասանելիություն 'խաղացողների մասնաբաժինը, որոնք միացրեցին ասիստի տարբերակները։ CSAT հասանելիություն։
- Մոդելի իրականացումը '«վերապատրաստման» քանակը, օպտիկայի մեծությունը և հաճախությունը։
- Վստահություն 'բողոքներ «խորտակման», տեսահոլովակներ «ինչու է հարմարվել»։
Իրականացման ճարտարապետությունը (ընդհանուր առմամբ)
1. Telemetria 'պայքարի/պազզլա, ռետրո, վնաս, ճշգրտություն, fps, դադար։ նորմալացում և անանուն։
2. Feature Store: rolling-ագրեգատները խաղացողի և հատվածի վրա։ սարքեր/ցանցեր։
3. Inference շերտը 'ավազակ/բայես/վերահսկիչներ; SLA <50-100 մզ։
4. Policy Engine: Limits, լող, արգելքներ (հատկապես խաղային խաղերի համար)։
5. Նվագախումբ 'կոդավորման կիրառում, հուշումներ, chekpoints, դադար։
6. Դիտարկումն այն է, որ առցանց տաշբորդները մետրիկ են, dreafa, A/B փորձարկումներ։
7. Դելվեսը և անվտանգությունը 'PII-ի նվազեցումը, նա-dewis infess-ը զգայուն, լոգարանների կոդավորումը։
Գնահատման գործընթացը 'A/B և առցանց տրամաչափը
A/B/C 'vs PID-ի ֆիքսված բարդությունը ավազակ է; metrics - flow-rate, քվիտներ, բավարարվածություն։- Զգայունության վերլուծություն. Ինչպես KPI-ն արձագանքում է միգրանցների սահմաններին։
- Կոորդինատների տրամաչափը 'սարք, փորձ, ռեժիմ (քարոզարշավի/լայնի), հասանելիություն։
Բնորոշ սխալներ և ինչպես խուսափել դրանցից
Պիլա դժվարություններ 'չափազանց ագրեսիվ քայլեր, որոնք պետք է ավելացնեն իներցիան/հիստերե)։- Երկաթ չի սովորեցնում, որ fps-ի անկումը «քողարկվում» է որպես հմտության բարձրացում։
- Մանիպուլյացիաները մրցանակով 'հետաձգել հաղթանակը պահպանելու համար' վստահության հարվածը։
- Թաքնություն 'բացատրության և ձեռքով վերահսկման բացակայություն, բողոքներ «խորտակման» մասին։
- Խաղային խաղեր 'ցանկացած ազդեցություն հավանականության վրա' իրավաբանական/էթիկական ռիսկ։
2025-2030 ճանապարհային քարտեզը
2025-2026 - Բազա
Թելեմետրիա, PID վերահսկիչներ տեմպի համար, բարդության կառավարման կենտրոն, A/B բանդիտների վրա, բացատրություններ խաղացողի համար։
2026-2027 - Հմտության մոդելներ
Բայեսովական սկիլը (Windows Skill-like), մրգերի կանխատեսումը (Transformer), անձնական «օգնության պատուհանը»։
2027-2028 - RL ռեժիմը
Սիմուլյատորները, անվտանգ քաղաքականությունները, RL գործակալը ալիքների/պազլների խմբակցությունների համար։ նա dewis assistic մոդել է։
2028-2029 - Միգրացիան և հասանելիությունը
DDA-ի պլագինները մակարդակների խմբագրողի համար, հասանելիության մեքենայի ստուգումը, էթիկայի մասին հանրային զեկույցները։
2030 - Ռուսական արդյունաբերություն
Հավաստագրված զգեստապահարանները, բացատրության լոգերի ընդհանուր ձևաչափը, «DDA-by-2019» -ը խաղացողի տեսանելի վերահսկողության հետ։
Օդաչուի չեկ թերթիկը (30-60 օր)
1. Մոսկվան «flow-միջանցք» է (օրինակ, 60-70 տոկոսը մրցույթի հաջողությունը)։
2. Միացրեք հիմնական ազդանշանների հեռաչափությունը և առանձնացրեք պերֆորմանսի գործոնները (fps/lag)։
3. SPID վերահսկիչը 1-2 (տեմպը, թայմինգի պատուհանը) փափուկ սահմաններով։
4. Զուգահեռաբար, համատեքստային ավազակ է դժվարությունների ճնշումների ընտրության համար։
5. Ավելացրեք UX վերահսկողությունը 'ռեժիմի անջատիչ, հուշումներ, «ինչու է փոխվել»։
6. Անցկացրեք A/B, չափեք flow, quits, CSAT-ը, ասիստի միացումը։
7. Տեղադրեք policy-gardrails (և ազարտային ռեժիմների համար 'հավանականության փոփոխության արգելքներ)։
8. Իտրանիան ամեն շաբաթ ՝ սահմանների թյունինգը, բացատրության բարելավումը, նոր հատվածների ընդլայնումը։
Մինի-քեյսները (նման է դրան)
Շուտեր ՝ Երեք մահվանից հետո, չեքպոինտայում, թշնամիների ճշգրտությունը նվազում է 6 տոկոսով և ավելի քիչ, քան նռնակները։ դիտարկման գիծ։
Պազլ '120 վայրկյան ստագոնացիայից հետո' ակտիվացված տարրերի շուրջ «կայծեր»։ հանելուկի գաղտնիքները + 10%։
Ռենները 'եթե fps-ը սայթաքում է, շրջակա միջավայրի արագությունը ժամանակավորապես նվազում է, բայց չեն փոխվում հիթբոքսները։
Սլոտ-լայքը (զվարճալի, ոչ մոլեխաղը), արագացնում են անիմացիաները մեջքի միջև, հայտնվում են ուսուցողական հուշումներ։ մաթեմատիկան չի փոխվում։
Բարդության AI-հարմարեցումը խաղացողի հարգանքի մասին է 'պահել այն հոսքի մեջ, օգնել հաղթահարել խոչընդոտները և տալ ընտրության ազատություն։ Տեխնիկապես այն հիմնված է հասկանալի ազդանշանների, թափանցիկ ալգորիթմների և կոշտ գարդրեյալների վրա։ Մոլարտային սցենարներում, հատկապես շահույթի հավանականության վրա ոչ մի ազդեցություն չկա 'միայն տեմպը, ներկայացումը և բարեկեցությունը։ Այսպիսով կառուցվում են խաղեր, որոնց հետ ուզում եմ վերադառնալ, որովհետև դրանք ազնիվ են, մատչելի և իսկապես հետաքրքրող։