AI ալգորիթմներ խաղերի բարդությունը հարմարեցնելու համար

Ե՞ րբ և ինչ հարմարեցնել

Տեմպը և տեմպը 'արագությունը, իրադարձությունների հաճախությունը, հակառակորդների թիվը, ալիքների թայմինգները։

Մարտավարական բարդություն 'բոտերի ճշգրտությունը, նրանց մարտավարությունը, ճանապարհի «կարողությունը»։

Պազլներն ու հուշումները 'ժամանակի պատուհանը, քայլերի քանակը, ակնարկների առկայությունը։
Ռեսուրսները և տնտեսությունը 'լութ, հիլ, չեկպոինտա, թայմ-աուտներ։
Ինտերֆեյսը և հասանելիությունը 'ավտո-տեսարան, հակադրություն, մեծ տառատեսակներ, «ռեժիմ առանց անջատման»։
Խաղային խաղեր. Դուք չեք կարող փոխել RTP/հավանականությունը/paytables/նիշերի քաշը, հարմարվում են միայն ներկայացմանը, անիմացիայի տեմպին, սովորեցնելուն, բովանդակության վիտրիններին և RG-noby- ին։

Ազդանշաններ. Ինչի՞ ց է AI-ն հասկանում «ցավի մակարդակը»

Առցանց ազդանշաններ

Անցման ժամանակը, գետերի, մահացությունների, վնասների/չափերի քանակը, ճշգրտությունը։

Վարքագծային փամփուշտներ 'կտրուկ «քվիտներ», դադարներ, թեթև ռեժիմով անցում։
Կենսաչափական/պարալինգվիստիկա (եթե խաղացողը հստակ թույլ տվեց) 'խոսքի/շնչառության տեմպը, միկրոպաուզացումը։
Սարքի/ցանցի հեռուստաչափությունը 'fps-drops, բայերը նպաստում են ռուսական երկաթի բարդությանը։

Offline/պրոֆիլը

Հաջողությունների պատմությունը ժանրերում/ռեժիմներում, որոնք սովորեցնում են մակարդակները, տրամաչափական թեստի արդյունքները։

Հասանելիության բարձրացումը (հակադրություն, TFC, auto-տեսարան) - հարգել ընտրությունը լռելյայն։

Մոդելներ և ալգորիթմներ

1) Հետադարձ կապի վերահսկիչները (արագ սկիզբը)

PID վերահսկիչը 'նպատակը միջին «լարման մակարդակն» է (օրինակ, հաջողության 60-70 տոկոսը)։

Շվեյցարիա: սխալը = նպատակն է իրական հաջողությունը (կամ TTK/retire-rate)։

Ելքը 'շարժիչի փոփոխության քայլ (արագությունը, AI ճշգրտությունը)։

Պլյուսներ ՝ պարզություն, կանխատեսելիություն։ Մինուսներ 'անհրաժեշտ է ձեռքի թյունինգ, տեղական օպտիմա։

2) Համատեքստային ավազակները (հարմարեցումը «այստեղ և հիմա»)

LinUCB/Thompson Sampling-ը համատեքստով 'skille, սարք, fps, տիպի շարժիչ։

Ընտրում են գործողություն (բարդությունների մի շարք), ավելացնելով «վարձատրությունը» (պահել/flow-score), հաշվի առնելով անորոշությունը։
Պլյուսներ 'ձևավորում են on.ru ուսուցում առանց ծանր ենթակառուցվածքի, արագ փոխակերպում։

3) Բայեսովի հմտության մոդելները

Windows Skill/Glicko-ը նման է խաղացողի վարկանիշի և «մրցույթի վարկանիշի»։

Նրանք կարոտում են հմտությունների կարճ և երկար դինամիկան, տալիս վստահելի ընդմիջումներ։
Օգտակար են խաղաթաղանթի և բարդության պլանավորման համար 'հասնելով մակարդակի։

4) Հաջորդականություն և կանխատեսում (RNN/Transformer)

Կանխատեսում են մրգերի/քվիտի հավանականությունը N րոպեի հորիզոնում։

Տես ՝ փորձերի հաջորդականություններ, վնասներ, սխալներ, UI միկրովայրկյաններ։
Ելքը '«գերտաքացման ռիսկը» փափուկ միջամտություն է (հուշում, չեկպոինտ, դադար)։

5) RL-ռեժիմը (մեծ երկարությունների համար)

Reinforcant Learning-ը որպես «բովանդակության ռեժիմը», գործակալը ընտրում է ալիքների/պազզլների կազմաձևը։

Վարձատրություն ՝ ժամանակը հոսքի մեջ, հոսանքների նվազումը, պահպանումը, հարգանքը RG/հասանելիության նկատմամբ։

Մենք պահանջում ենք սիմուլյատորներ/սինթետիկ խաղացողներ և կոշտ զգեստապահարաններ, որպեսզի չպատրաստենք մանիպուլյացիա։

Քաղաքականություններ և հանդերձանքներ (լռելյայն էթիկա)

Բոտերի ճշգրտության վրա, արագությունը, թշնամիների քանակը։

Փոփոխության սահունությունը 'ոչ ավելի քան X տոկոսը Y վայրկյանում; խուսափել «ճոճանակներից»։
Թափանցիկությունն ու վերահսկողությունը 'խաղացողը կարող է շտկել բարդությունը, անջատել DDA-ն, ներառել «story mode»։
Հասանելիություն> chelenge: Հասանելիության տարբերակները միշտ ավելի ուժեղ են, քան ավտոմատ բարդությունը։
Խաղային խաղեր 'շանսերի հարմարեցում/2019; միայն ուսուցիչներ, տեմպեր և RG միջամտություններ։
Anti էքսպլոյթ 'պաշտպանություն «sandbagging» -ից (արհեստական թերագնահատումը սկիլայի համար բոնուսների համար)։

UX-patterns «խնամքի» հարմարեցում

Micropodage-ից հետո. <<Ուղարկեք հասցեները ակնարկի համար (առանց տուգանքների)>>։

Փափուկ դադար. <<Թվում է, որ սեգմենտը ավելի բարդ է, քան սովորականը։ Պարզեցնել թայմինգները։ [Այո/Ոչ]"։

Կալիբուլյատիվ մակարդակը '1-2 րոպե պրակտիկայի արագ սահմանումով։

Բարդության վերահսկման կենտրոն 'տեսանելի է ներկա մակարդակի հետ, փոփոխության պատմություն, «վերադարձնել»։

Հաղորդակցություն առանց ստիգմայի 'խուսափել «Դուք չափազանց թույլ եք»։ Ավելի լավ է ․ «Եկեք հարմարավետ տեմպեր վերցնենք»։

Հաջողության մետրերը (KPI)

Flow/հաջողությունը 'K փորձարկումների համար հատվածների անցման միջին տոկոսը։ միջին ժամանակը «մինի հաղթանակների» միջև։

Retray/քվիտ 'rage-quit նվազեցում, կիսարարների նվազում շեմից բարձր։

Պահպանումը և նստաշրջանները ՝ DAU/WAU, ընդմիջումներով ժամանակ, վերադարձնելով բարդ հատվածներին։
Հասանելիություն 'խաղացողների մասնաբաժինը, որոնք միացրեցին ասիստի տարբերակները։ CSAT հասանելիություն։
Մոդելի իրականացումը '«վերապատրաստման» քանակը, օպտիկայի մեծությունը և հաճախությունը։
Վստահություն 'բողոքներ «խորտակման», տեսահոլովակներ «ինչու է հարմարվել»։

Իրականացման ճարտարապետությունը (ընդհանուր առմամբ)

1. Telemetria 'պայքարի/պազզլա, ռետրո, վնաս, ճշգրտություն, fps, դադար։ նորմալացում և անանուն։

2. Feature Store: rolling-ագրեգատները խաղացողի և հատվածի վրա։ սարքեր/ցանցեր։

3. Inference շերտը 'ավազակ/բայես/վերահսկիչներ; SLA <50-100 մզ։

4. Policy Engine: Limits, լող, արգելքներ (հատկապես խաղային խաղերի համար)։

5. Նվագախումբ 'կոդավորման կիրառում, հուշումներ, chekpoints, դադար։

6. Դիտարկումն այն է, որ առցանց տաշբորդները մետրիկ են, dreafa, A/B փորձարկումներ։

7. Դելվեսը և անվտանգությունը 'PII-ի նվազեցումը, նա-dewis infess-ը զգայուն, լոգարանների կոդավորումը։

Գնահատման գործընթացը 'A/B և առցանց տրամաչափը

A/B/C 'vs PID-ի ֆիքսված բարդությունը ավազակ է; metrics - flow-rate, քվիտներ, բավարարվածություն։

Զգայունության վերլուծություն. Ինչպես KPI-ն արձագանքում է միգրանցների սահմաններին։
Կոորդինատների տրամաչափը 'սարք, փորձ, ռեժիմ (քարոզարշավի/լայնի), հասանելիություն։

Բնորոշ սխալներ և ինչպես խուսափել դրանցից

Պիլա դժվարություններ 'չափազանց ագրեսիվ քայլեր, որոնք պետք է ավելացնեն իներցիան/հիստերե)։

Երկաթ չի սովորեցնում, որ fps-ի անկումը «քողարկվում» է որպես հմտության բարձրացում։
Մանիպուլյացիաները մրցանակով 'հետաձգել հաղթանակը պահպանելու համար' վստահության հարվածը։
Թաքնություն 'բացատրության և ձեռքով վերահսկման բացակայություն, բողոքներ «խորտակման» մասին։
Խաղային խաղեր 'ցանկացած ազդեցություն հավանականության վրա' իրավաբանական/էթիկական ռիսկ։

2025-2030 ճանապարհային քարտեզը

2025-2026 - Բազա

Թելեմետրիա, PID վերահսկիչներ տեմպի համար, բարդության կառավարման կենտրոն, A/B բանդիտների վրա, բացատրություններ խաղացողի համար։

2026-2027 - Հմտության մոդելներ

Բայեսովական սկիլը (Windows Skill-like), մրգերի կանխատեսումը (Transformer), անձնական «օգնության պատուհանը»։

2027-2028 - RL ռեժիմը

Սիմուլյատորները, անվտանգ քաղաքականությունները, RL գործակալը ալիքների/պազլների խմբակցությունների համար։ նա dewis assistic մոդել է։

2028-2029 - Միգրացիան և հասանելիությունը

DDA-ի պլագինները մակարդակների խմբագրողի համար, հասանելիության մեքենայի ստուգումը, էթիկայի մասին հանրային զեկույցները։

2030 - Ռուսական արդյունաբերություն

Հավաստագրված զգեստապահարանները, բացատրության լոգերի ընդհանուր ձևաչափը, «DDA-by-2019» -ը խաղացողի տեսանելի վերահսկողության հետ։

Օդաչուի չեկ թերթիկը (30-60 օր)

1. Մոսկվան «flow-միջանցք» է (օրինակ, 60-70 տոկոսը մրցույթի հաջողությունը)։

2. Միացրեք հիմնական ազդանշանների հեռաչափությունը և առանձնացրեք պերֆորմանսի գործոնները (fps/lag)։

3. SPID վերահսկիչը 1-2 (տեմպը, թայմինգի պատուհանը) փափուկ սահմաններով։

4. Զուգահեռաբար, համատեքստային ավազակ է դժվարությունների ճնշումների ընտրության համար։

5. Ավելացրեք UX վերահսկողությունը 'ռեժիմի անջատիչ, հուշումներ, «ինչու է փոխվել»։

6. Անցկացրեք A/B, չափեք flow, quits, CSAT-ը, ասիստի միացումը։

7. Տեղադրեք policy-gardrails (և ազարտային ռեժիմների համար 'հավանականության փոփոխության արգելքներ)։

8. Իտրանիան ամեն շաբաթ ՝ սահմանների թյունինգը, բացատրության բարելավումը, նոր հատվածների ընդլայնումը։

Մինի-քեյսները (նման է դրան)

Շուտեր ՝ Երեք մահվանից հետո, չեքպոինտայում, թշնամիների ճշգրտությունը նվազում է 6 տոկոսով և ավելի քիչ, քան նռնակները։ դիտարկման գիծ։

Պազլ '120 վայրկյան ստագոնացիայից հետո' ակտիվացված տարրերի շուրջ «կայծեր»։ հանելուկի գաղտնիքները + 10%։

Ռենները 'եթե fps-ը սայթաքում է, շրջակա միջավայրի արագությունը ժամանակավորապես նվազում է, բայց չեն փոխվում հիթբոքսները։

Սլոտ-լայքը (զվարճալի, ոչ մոլեխաղը), արագացնում են անիմացիաները մեջքի միջև, հայտնվում են ուսուցողական հուշումներ։ մաթեմատիկան չի փոխվում։

Բարդության AI-հարմարեցումը խաղացողի հարգանքի մասին է 'պահել այն հոսքի մեջ, օգնել հաղթահարել խոչընդոտները և տալ ընտրության ազատություն։ Տեխնիկապես այն հիմնված է հասկանալի ազդանշանների, թափանցիկ ալգորիթմների և կոշտ գարդրեյալների վրա։ Մոլարտային սցենարներում, հատկապես շահույթի հավանականության վրա ոչ մի ազդեցություն չկա 'միայն տեմպը, ներկայացումը և բարեկեցությունը։ Այսպիսով կառուցվում են խաղեր, որոնց հետ ուզում եմ վերադառնալ, որովհետև դրանք ազնիվ են, մատչելի և իսկապես հետաքրքրող։