الگوریتم های AI برای انطباق پیچیدگی بازی
چه زمانی و دقیقا چه چیزی برای انطباق
سرعت و بار: سرعت صاف، فرکانس رویداد، تعداد مخالفان، زمان موج است.
پیچیدگی تاکتیکی: دقت رباتها، تاکتیکهای آنها، «هوشمندی» مسیر.
پازل و نکات: پنجره زمان، تعداد مراحل، حضور «نکات».
منابع و اقتصاد: غارت، khil، ایست بازرسی، وقفه.
رابط و دسترسی: خودکار دید، کنتراست، فونت های بزرگ، «حالت حرکت آزاد».
قمار ️: شما نمی توانید RTP/احتمالات/paytables/وزن شخصیت را تغییر دهید - فقط ارائه، سرعت انیمیشن، راهنمایی های آموزشی، ویترین محتوا و اعداد RG سازگار است.
سیگنال ها: آنچه هوش مصنوعی «سطح درد» را درک می کند
سیگنال های آنلاین
زمان بخش، تعداد بازپرداخت، مرگ و میر، آسیب/دقیقه، دقت.
الگوهای رفتاری: «ترک» تیز، مکث، تغییر به حالت نور.
Biometrics/paralinguistics (اگر بازیکن به صراحت اجازه): میزان گفتار/تنفس، micropause.
تله متری دستگاه/شبکه: FPS قطره، تاخیر → پیچیدگی ≠ سخت افزار.
آفلاین/مشخصات
تاریخچه موفقیت بر اساس سبک/حالت، سطح آموزش، نتایج آزمون کالیبراسیون.
تنظیمات دسترسی (کنتراست، TTS، دید خودکار) - به انتخاب پیش فرض احترام بگذارید.
مدل ها و الگوریتم ها
1) کنترل کننده های بازخورد (شروع سریع)
کنترل کننده PID: هدف «سطح ولتاژ» متوسط است (به عنوان مثال 60 تا 70 درصد موفقیت)
ورودی: خطا = هدف − موفقیت فعلی (یا TTK/نرخ بازنشستگی).
خروجی: مرحله تغییر پارامترها (سرعت برابر است، دقت AI).
مزایا: سادگی، قابل پیش بینی بودن. معایب: تنظیم دستی مورد نیاز، optima محلی.
2) راهزنان متنی («اینجا و اکنون» سازگاری)
LinUCB/تامپسون نمونه برداری با زمینه: مهارت، دستگاه، FPS، نوع بخش.
یک عمل (مجموعه ای از پارامترهای پیچیدگی) انتخاب شده است، به حداکثر رساندن «پاداش» (نگه داشتن/جریان نمره) با توجه به عدم قطعیت حساب.
مزایا: آموزش آنلاین بدون زیرساخت های سنگین، به سرعت همگرا می شود.
3) مدل های مهارت بیزی
TrueSkill/Glicko مانند به روز رسانی به بازیکن امتیاز و «رتبه بخش».
دینامیک مهارت کوتاه و بلند بخیه زده می شود، فواصل اطمینان داده می شود.
مفید برای خواستگاری و پیش تنظیم اولیه مشکل قبل از ورود به سطح.
4) توالی و پیش بینی (RNN/ترانسفورماتور)
احتمال ناامیدی/ترک در افق N دقیقه پیش بینی شده است.
ورودی: دنباله ای از تلاش ها، آسیب ها، خطاها، UI رویدادهای میکرو.
خروج: «خطر بیش از حد» → مداخله خفیف (اشاره، ایست بازرسی، مکث).
5) کارگردانی RL (برای تولیدات بزرگ)
یادگیری تجدید به عنوان «مدیر محتوا»: عامل تنظیمات موج/پازل را انتخاب می کند.
پاداش: زمان در جریان، کاهش retraces، حفظ، احترام به RG/در دسترس بودن.
شبیه سازی/بازیکنان مصنوعی و گاردریل سخت مورد نیاز به طوری که به «آموزش» دستکاری نیست.
سیاست ها و گاردریل (اخلاق به طور پیش فرض)
مرزهای پارامتر سخت: حداقل/حداکثر برای دقت ربات، سرعت، تعداد دشمنان.
صاف بودن تغییرات: بیش از X٪ تغییر در Y ثانیه ؛ اجتناب از «چرخش»
شفافیت و کنترل: بازیکن می تواند مشکل را حل کند، DDA را غیرفعال کند، «حالت داستان» را فعال کند.
قابلیت دسترسی> چالش: گزینه های دسترسی همیشه قوی تر از پیچیدگی خودکار است.
قمار: هیچ سازگاری از شانس/پرداخت; فقط دستورالعمل های آموزشی، سرعت و مداخلات RG.
ضد بهره برداری: حفاظت در برابر «sandbagging» (مصنوعی کم مهارت برای پاداش).
الگوهای UX از سازگاری «دقیق»
میکرو داستان پس از شکست N: «فشار ⓘ برای اشاره (بدون جریمه)».
مکث نرم: "به نظر می رسد بخش سخت تر از حد معمول است. زمان بندی را ساده کنید ؟ (بله، نه)"
سطح کالیبراسیون: 1-2 دقیقه تمرین با تعیین سریع مشخصات اولیه.
مرکز کنترل پیچیدگی: ویجت با سطح فعلی، تاریخچه تغییرات، گزینه «بازگشت به عنوان آن بود».
ارتباط بدون ننگ: اجتناب از "شما خیلی ضعیف هستید. "بهتر است: "بیایید یک سرعت راحت را انتخاب کنیم"
معیارهای موفقیت (KPIs)
جریان/موفقیت: به طور متوسط٪ از بخش های عبور در ≤K تلاش ؛ متوسط زمان بین «پیروزی های کوچک»
Retray/quit: کاهش خشم، کاهش تکرار در آستانه.
برگزاری و جلسات: DAU/WAU، زمان متناوب، بازگشت به بخش های پیچیده.
در دسترس بودن: سهم بازیکنان که شامل گزینه های کمک ؛ CSAT در دسترس بودن
ثبات مدل: تعداد «retrains»، اندازه و فرکانس تنظیمات.
اعتماد: شکایت در مورد «چرخش»، کلیک بر روی «چرا اقتباس».
معماری پیاده سازی (طرح کلی)
1. تله متری: حوادث نبرد/پازل، retrays، آسیب، دقت، fps، مکث ؛ عادی سازی و ناشناس سازی.
2. فروشگاه ویژگی: جمع آوری نورد توسط بازیکن و بخش ؛ ویژگی های دستگاه/شبکه.
3. لایه استنتاج: راهزن/بیز/کنترل کننده ؛ SLA <50-100 میلی ثانیه.
4. موتور سیاست: محدودیت ها، صافی، ممنوعیت ها (به ویژه برای قمار).
5. ارکستراسیون: اعمال پارامترها، نکات، ایستگاه های بازرسی، مکث.
6. قابلیت مشاهده: داشبورد آنلاین معیارها، هشدارهای رانش، آزمایش A/B.
7. حریم خصوصی و امنیت: به حداقل رساندن PII، استنتاج دستگاه برای حساس، رمزگذاری سیاهههای مربوط.
فرایند ارزیابی: A/B و کالیبراسیون آنلاین
A/B/C: پیچیدگی ثابت در مقابل PID در مقابل راهزن ؛ معیارهای هدف - نرخ جریان، خروج، رضایت.
تجزیه و تحلیل حساسیت: چگونه KPI ها به مرزهای پارامتر پاسخ می دهند.
کالیبراسیون توسط کوهورت: دستگاه، تجربه، حالت (کمپین/زنده)، در دسترس بودن.
اشتباهات رایج و چگونگی اجتناب از آنها
مشکل دید: مراحل بیش از حد تهاجمی → اضافه کردن اینرسی/هیسترزیس.
بدون در نظر گرفتن آهن: سقوط fps به عنوان رشد مهارت «پنهان» می شود و عملکرد را از مهارت جدا می کند.
دستکاری پاداش: به تأخیر انداختن پیروزی به خاطر حفظ، ضربه ای به اعتماد است.
مخفیکاری: عدم توضیح و کنترل دستی → شکایات «چرخش».
قمار: هر گونه تاثیر بر احتمال - خطر قانونی/اخلاقی.
نقشه راه 2025-2030
2025-2026 - پایه
تله متری، کنترل PID برای سرعت، مرکز کنترل دشواری، A/B در راهزنان، توضیحات برای بازیکن.
2026-2027 - مدل های مهارت
مهارت بیزی (TrueSkill مانند)، پیش بینی سرخوردگی (ترانسفورماتور)، شخصی «پنجره کمک».
2027-2028 - RL کارگردانی
شبیه سازی، سیاست های امن، عامل RL برای تنظیمات موج/پازل ؛ او دستگاه مدل کمک.
2028-2029 - قابلیت ترکیب و در دسترس بودن
پلاگین های DDA برای ویرایشگر سطح، چک های دسترسی خودکار، گزارش های اخلاق عمومی.
2030 - استاندارد صنعت
gardrails گواهی، فرمت کلی سیاهههای مربوط قابل توضیح، «DDA-به طور پیش فرض» با کنترل پخش قابل مشاهده است.
چک لیست خلبان (30-60 روز)
1. کریدور جریان هدف را تعریف کنید (به عنوان مثال، موفقیت بخش 60-70٪).
2. تله متری سیگنال های کلیدی را روشن کنید و عوامل عملکرد (fps/lag) را جدا کنید.
3. کنترل کننده PID را در پارامترهای 1-2 (سرعت، پنجره زمان بندی) با مرزهای نرم شروع کنید.
4. به موازات - یک باند متنی برای انتخاب ایستگاه از پیش تنظیم پیچیدگی.
5. کنترل UX را اضافه کنید: سوئیچ حالت، اعلان، «چرا تغییر کرده است».
6. انجام A/B، اندازه گیری جریان، خروج، CSAT، شامل گزینه های کمک.
7. شروع سیاست گاردریل (و برای حالت های قمار - ممنوعیت در تغییر احتمالات).
8. تکرار هفتگی: تنظیم مرزها، بهبود قابلیت توضیح، گسترش به بخش های جدید.
موارد کوچک (آنچه به نظر می رسد)
تیرانداز: پس از 3 مرگ در ایست بازرسی - دقت دشمنان 6٪ و کمتر از نارنجک کاهش می یابد. نکته ابزار خط دید.
پازل: پس از 120 ثانیه رکود - «جرقه» در اطراف عناصر فعال ؛ تایمر معما + 10٪.
دونده: اگر fps sags، سرعت محیط به طور موقت کاهش می یابد، اما hitboxes تغییر نمی کند.
اسلات مانند (سرگرم کننده، قمار نیست): انیمیشن ها بین پشت ها شتاب می گیرند، راهنمایی های آموزشی ظاهر می شود ؛ ریاضی برنده تغییر نمی کند.
سازگاری AI از پیچیدگی در مورد احترام به بازیکن است: نگه داشتن او در جریان، کمک به غلبه بر موانع و دادن آزادی انتخاب. از لحاظ فنی، به سیگنال های روشن، الگوریتم های شفاف و گاردریل های سخت متکی است. در سناریوهای قمار - حتی بیشتر - هیچ تاثیری بر احتمال برنده شدن وجود ندارد: تنها سرعت، خدمت و نگرانی برای رفاه. این است که چگونه بازی ها ساخته شده است که شما می خواهید به بازگشت - چرا که آنها صادقانه، در دسترس و واقعا هیجان انگیز است.