الگوریتم های AI برای انطباق پیچیدگی بازی

چه زمانی و دقیقا چه چیزی برای انطباق

سرعت و بار: سرعت صاف، فرکانس رویداد، تعداد مخالفان، زمان موج است.

پیچیدگی تاکتیکی: دقت رباتها، تاکتیکهای آنها، «هوشمندی» مسیر.

پازل و نکات: پنجره زمان، تعداد مراحل، حضور «نکات».

منابع و اقتصاد: غارت، khil، ایست بازرسی، وقفه.

رابط و دسترسی: خودکار دید، کنتراست، فونت های بزرگ، «حالت حرکت آزاد».

قمار ️: شما نمی توانید RTP/احتمالات/paytables/وزن شخصیت را تغییر دهید - فقط ارائه، سرعت انیمیشن، راهنمایی های آموزشی، ویترین محتوا و اعداد RG سازگار است.

سیگنال ها: آنچه هوش مصنوعی «سطح درد» را درک می کند

سیگنال های آنلاین

زمان بخش، تعداد بازپرداخت، مرگ و میر، آسیب/دقیقه، دقت.

الگوهای رفتاری: «ترک» تیز، مکث، تغییر به حالت نور.

Biometrics/paralinguistics (اگر بازیکن به صراحت اجازه): میزان گفتار/تنفس، micropause.

تله متری دستگاه/شبکه: FPS قطره، تاخیر → پیچیدگی ≠ سخت افزار.

آفلاین/مشخصات

تاریخچه موفقیت بر اساس سبک/حالت، سطح آموزش، نتایج آزمون کالیبراسیون.

تنظیمات دسترسی (کنتراست، TTS، دید خودکار) - به انتخاب پیش فرض احترام بگذارید.

مدل ها و الگوریتم ها

1) کنترل کننده های بازخورد (شروع سریع)

کنترل کننده PID: هدف «سطح ولتاژ» متوسط است (به عنوان مثال 60 تا 70 درصد موفقیت)

ورودی: خطا = هدف − موفقیت فعلی (یا TTK/نرخ بازنشستگی).

خروجی: مرحله تغییر پارامترها (سرعت برابر است، دقت AI).

مزایا: سادگی، قابل پیش بینی بودن. معایب: تنظیم دستی مورد نیاز، optima محلی.

2) راهزنان متنی («اینجا و اکنون» سازگاری)

LinUCB/تامپسون نمونه برداری با زمینه: مهارت، دستگاه، FPS، نوع بخش.

یک عمل (مجموعه ای از پارامترهای پیچیدگی) انتخاب شده است، به حداکثر رساندن «پاداش» (نگه داشتن/جریان نمره) با توجه به عدم قطعیت حساب.

مزایا: آموزش آنلاین بدون زیرساخت های سنگین، به سرعت همگرا می شود.

3) مدل های مهارت بیزی

TrueSkill/Glicko مانند به روز رسانی به بازیکن امتیاز و «رتبه بخش».

دینامیک مهارت کوتاه و بلند بخیه زده می شود، فواصل اطمینان داده می شود.

مفید برای خواستگاری و پیش تنظیم اولیه مشکل قبل از ورود به سطح.

4) توالی و پیش بینی (RNN/ترانسفورماتور)

احتمال ناامیدی/ترک در افق N دقیقه پیش بینی شده است.

ورودی: دنباله ای از تلاش ها، آسیب ها، خطاها، UI رویدادهای میکرو.

خروج: «خطر بیش از حد» → مداخله خفیف (اشاره، ایست بازرسی، مکث).

5) کارگردانی RL (برای تولیدات بزرگ)

یادگیری تجدید به عنوان «مدیر محتوا»: عامل تنظیمات موج/پازل را انتخاب می کند.

پاداش: زمان در جریان، کاهش retraces، حفظ، احترام به RG/در دسترس بودن.

شبیه سازی/بازیکنان مصنوعی و گاردریل سخت مورد نیاز به طوری که به «آموزش» دستکاری نیست.

سیاست ها و گاردریل (اخلاق به طور پیش فرض)

مرزهای پارامتر سخت: حداقل/حداکثر برای دقت ربات، سرعت، تعداد دشمنان.

صاف بودن تغییرات: بیش از X٪ تغییر در Y ثانیه ؛ اجتناب از «چرخش»

شفافیت و کنترل: بازیکن می تواند مشکل را حل کند، DDA را غیرفعال کند، «حالت داستان» را فعال کند.

قابلیت دسترسی> چالش: گزینه های دسترسی همیشه قوی تر از پیچیدگی خودکار است.

قمار: هیچ سازگاری از شانس/پرداخت; فقط دستورالعمل های آموزشی، سرعت و مداخلات RG.

ضد بهره برداری: حفاظت در برابر «sandbagging» (مصنوعی کم مهارت برای پاداش).

الگوهای UX از سازگاری «دقیق»

میکرو داستان پس از شکست N: «فشار ⓘ برای اشاره (بدون جریمه)».

مکث نرم: "به نظر می رسد بخش سخت تر از حد معمول است. زمان بندی را ساده کنید ؟ (بله، نه)"

سطح کالیبراسیون: 1-2 دقیقه تمرین با تعیین سریع مشخصات اولیه.

مرکز کنترل پیچیدگی: ویجت با سطح فعلی، تاریخچه تغییرات، گزینه «بازگشت به عنوان آن بود».

ارتباط بدون ننگ: اجتناب از "شما خیلی ضعیف هستید. "بهتر است: "بیایید یک سرعت راحت را انتخاب کنیم"

معیارهای موفقیت (KPIs)

جریان/موفقیت: به طور متوسط٪ از بخش های عبور در ≤K تلاش ؛ متوسط زمان بین «پیروزی های کوچک»

Retray/quit: کاهش خشم، کاهش تکرار در آستانه.

برگزاری و جلسات: DAU/WAU، زمان متناوب، بازگشت به بخش های پیچیده.

در دسترس بودن: سهم بازیکنان که شامل گزینه های کمک ؛ CSAT در دسترس بودن

ثبات مدل: تعداد «retrains»، اندازه و فرکانس تنظیمات.

اعتماد: شکایت در مورد «چرخش»، کلیک بر روی «چرا اقتباس».

معماری پیاده سازی (طرح کلی)

1. تله متری: حوادث نبرد/پازل، retrays، آسیب، دقت، fps، مکث ؛ عادی سازی و ناشناس سازی.

2. فروشگاه ویژگی: جمع آوری نورد توسط بازیکن و بخش ؛ ویژگی های دستگاه/شبکه.

3. لایه استنتاج: راهزن/بیز/کنترل کننده ؛ SLA <50-100 میلی ثانیه.

4. موتور سیاست: محدودیت ها، صافی، ممنوعیت ها (به ویژه برای قمار).

5. ارکستراسیون: اعمال پارامترها، نکات، ایستگاه های بازرسی، مکث.

6. قابلیت مشاهده: داشبورد آنلاین معیارها، هشدارهای رانش، آزمایش A/B.

7. حریم خصوصی و امنیت: به حداقل رساندن PII، استنتاج دستگاه برای حساس، رمزگذاری سیاهههای مربوط.

فرایند ارزیابی: A/B و کالیبراسیون آنلاین

A/B/C: پیچیدگی ثابت در مقابل PID در مقابل راهزن ؛ معیارهای هدف - نرخ جریان، خروج، رضایت.

تجزیه و تحلیل حساسیت: چگونه KPI ها به مرزهای پارامتر پاسخ می دهند.

کالیبراسیون توسط کوهورت: دستگاه، تجربه، حالت (کمپین/زنده)، در دسترس بودن.

اشتباهات رایج و چگونگی اجتناب از آنها

مشکل دید: مراحل بیش از حد تهاجمی → اضافه کردن اینرسی/هیسترزیس.

بدون در نظر گرفتن آهن: سقوط fps به عنوان رشد مهارت «پنهان» می شود و عملکرد را از مهارت جدا می کند.

دستکاری پاداش: به تأخیر انداختن پیروزی به خاطر حفظ، ضربه ای به اعتماد است.

مخفیکاری: عدم توضیح و کنترل دستی → شکایات «چرخش».

قمار: هر گونه تاثیر بر احتمال - خطر قانونی/اخلاقی.

نقشه راه 2025-2030

2025-2026 - پایه

تله متری، کنترل PID برای سرعت، مرکز کنترل دشواری، A/B در راهزنان، توضیحات برای بازیکن.

2026-2027 - مدل های مهارت

مهارت بیزی (TrueSkill مانند)، پیش بینی سرخوردگی (ترانسفورماتور)، شخصی «پنجره کمک».

2027-2028 - RL کارگردانی

شبیه سازی، سیاست های امن، عامل RL برای تنظیمات موج/پازل ؛ او دستگاه مدل کمک.

2028-2029 - قابلیت ترکیب و در دسترس بودن

پلاگین های DDA برای ویرایشگر سطح، چک های دسترسی خودکار، گزارش های اخلاق عمومی.

2030 - استاندارد صنعت

gardrails گواهی، فرمت کلی سیاهههای مربوط قابل توضیح، «DDA-به طور پیش فرض» با کنترل پخش قابل مشاهده است.

چک لیست خلبان (30-60 روز)

1. کریدور جریان هدف را تعریف کنید (به عنوان مثال، موفقیت بخش 60-70٪).

2. تله متری سیگنال های کلیدی را روشن کنید و عوامل عملکرد (fps/lag) را جدا کنید.

3. کنترل کننده PID را در پارامترهای 1-2 (سرعت، پنجره زمان بندی) با مرزهای نرم شروع کنید.

4. به موازات - یک باند متنی برای انتخاب ایستگاه از پیش تنظیم پیچیدگی.

5. کنترل UX را اضافه کنید: سوئیچ حالت، اعلان، «چرا تغییر کرده است».

6. انجام A/B، اندازه گیری جریان، خروج، CSAT، شامل گزینه های کمک.

7. شروع سیاست گاردریل (و برای حالت های قمار - ممنوعیت در تغییر احتمالات).

8. تکرار هفتگی: تنظیم مرزها، بهبود قابلیت توضیح، گسترش به بخش های جدید.

موارد کوچک (آنچه به نظر می رسد)

تیرانداز: پس از 3 مرگ در ایست بازرسی - دقت دشمنان 6٪ و کمتر از نارنجک کاهش می یابد. نکته ابزار خط دید.

پازل: پس از 120 ثانیه رکود - «جرقه» در اطراف عناصر فعال ؛ تایمر معما + 10٪.

دونده: اگر fps sags، سرعت محیط به طور موقت کاهش می یابد، اما hitboxes تغییر نمی کند.

اسلات مانند (سرگرم کننده، قمار نیست): انیمیشن ها بین پشت ها شتاب می گیرند، راهنمایی های آموزشی ظاهر می شود ؛ ریاضی برنده تغییر نمی کند.

سازگاری AI از پیچیدگی در مورد احترام به بازیکن است: نگه داشتن او در جریان، کمک به غلبه بر موانع و دادن آزادی انتخاب. از لحاظ فنی، به سیگنال های روشن، الگوریتم های شفاف و گاردریل های سخت متکی است. در سناریوهای قمار - حتی بیشتر - هیچ تاثیری بر احتمال برنده شدن وجود ندارد: تنها سرعت، خدمت و نگرانی برای رفاه. این است که چگونه بازی ها ساخته شده است که شما می خواهید به بازگشت - چرا که آنها صادقانه، در دسترس و واقعا هیجان انگیز است.