كيفية تحديد لحظة التوقف حسب الاحتمال

لماذا تحتاج إلى «لحظة توقف حسب الاحتمال»

التوقف هو حدث محدد مسبقًا توقف فيه اللعبة/الجلسة لأن احتمال حدوث نتيجة غير مواتية قد تجاوز الحد المسموح به، أو على العكس من ذلك، تم تحقيق الهدف. على عكس «بما فيه الكفاية» العاطفية، يعتمد التوقف الاحتمالي على:

1. حواجز النتائج (الربح/التخفيض التدريجي) ؛

2. تقدير الاحتمالات (ع، EV، الفرق) ؛

3. مقاييس المخاطر (خطر الخراب، احتمال الاستنتاج الخاطئ، فترات الثقة) ؛

4. توقف عن الاختبارات (قواعد SPRT/Bayesian).

1) النموذج الأساسي: حاجزان استيعابيان (الهدف والتوقف)

تخيل رأس المال متفاوتًا في الخطوات (معدل/جولة): أعلى مع الاحتمال (p)، أسفل مع الاحتمال (q = 1-p). نقدم حاجزين: أعلى (+ T) (هدف الربح) وأقل (-L) (توقف عن الخسارة). بمجرد وصول رأس المال إلى أحدهم - توقف.

احتمال الوصول إلى الهدف قبل القدم (فئة «خراب اللاعب»)

إذا كانت الخطوات هي نفسها في القيمة المطلقة و (p\ne q)، فعندما تبدأ من 0، مع الأهداف في خطوات (N = T/\Delta) لأعلى و (M = L/\Delta) لأسفل:

[
\ mathsf {P} {\text {get to} + T}; = ;\frac {1- (q/p) ^ {M}} {1- (q/p) ^ {M + N}}
]

При (p = q = 0 {.} 5): (\mathsf {P} =\frac {M} {M + N}).

القاعدة: حدد (T) و (L) بحيث (\mathsf {P}) يطابق معدل النجاح المستهدف (على سبيل المثال، ≥ 60٪). هذه محطة على الحاجز: لقد وصلنا إلى أحد المستويات - للخروج.

استنتاج عملي: غير مواتٍ (p/le 0. 5) الأهداف والأقدام المتماثلة تعطي نجاحًا بنسبة ≤50٪. فقط عدم تناسق الحواجز (توقف أصغر، هدف أكبر) أو الفعلي (EV> 0) يمكن تعويضه.

2) توقف عن خطر الخراب (RoR) قرب نهاية الأفق

لنفترض أن لديك بنكًا (B)، راهن كحصة (f)، تقلب دائري (\sigma)، ميزة (e) (عائد متوقع لكل جولة). بالنسبة للأفق الأخير (N)، فأنت مهتم بما يلي: «ما هي فرصة الانخفاض إلى ما دون المستوى الحرج (B_{\min}) حتى النهاية ؟» إذا أصبح RoR المشروط عند السحب الحالي (DD) ≥ العتبة المحددة (\beta) (على سبيل المثال، 5٪)، فإننا نتوقف.

العمل الاستدلالي: إذا لعبت أسهمًا من Kelly، فعندما تقع في الحد الأقصى المسموح به (على سبيل المثال، 20-30٪ مع نصف Kelly) - توقف حتى تتم استعادة المعلمات (إعادة الحساب (p، e ،\sigma)، قل (و)).

3) توقف الثقة للفوز/الاحتمال

عندما تكون الاحتمالات الحقيقية (p) غير معروفة (الفتحات، الأسواق الحية)، فإنك تقوم بتحديث درجة المراقبة. ليكن هناك (ث) «نجاحات» في التجريد الثنائي لـ (ن) المحاولات. بناء CI ثنائي الجانب 95٪ لـ (p) (على سبيل المثال، Clopper-Pearson). إذا انخفض الحد الأعلى CI لمركبتك الكهربائية الحقيقية ≤ 0، فإن القاعدة هي:

💡 توقف، لأنه مع البيانات الحالية، حتى التقييم الإيجابي لا يؤكد توقعًا إيجابيًا بثقة كافية.

العكس: إذا كان الحد الأدنى لـ CI لـ (p) أعلى من العتبة التي تجعل EV> 0، فيمكنك الاستمرار في أقرب حاجز ربح/وقت.

4) توقف بايزي: «احتمال أن EV ≤ 0»

ضبط قبل (p) (beta distribution (\text {Beta} (\alpha _ 0 ,\beta _ 0)). بعد (w) «النجاحات» في (n) التجارب، الخلفية (\النص {Beta} (\alpha _ 0 + w ،\beta _ 0 + n-w)). إعادة حساب الاحتمال الخلفي للفرضية «(EV\le 0)» (مع مراعاة معاملات المردود).

القاعدة: إذا (\mathsf {P} (EV\le 0\mid\text {data} )\ge\tau) (على سبيل المثال، 80-90٪)، - توقف.

الإيجابيات: المحاسبة السلسة للمعلومات المسبقة، والاستقرار في العينات الصغيرة.

5) اختبار والد المتسلسل (SPRT) - «حل عبر الإنترنت»

اختبارات SPRT (H_0) مقابل (H_1) أثناء الطيران، بعد كل نتيجة. قمت بتعيين الأخطاء المقبولة: (\alpha) (إنذار كاذب) و (\beta) (تخطي الميزة)، واثنين من الفرضيات بواسطة (p):

(H_0: ؛ p = p _ 0) (الحدود حيث EV ≤ 0)، (H_1:; p = p _ 1) (الفائدة المتوقعة).

يتم النظر في نسبة احتمالية السجل (LLR).

وقف القواعد:

إذا كان LLR ≥ (\ln\frac {1-\beta} {\alpha}) → قبول (H_1) (الميزة مؤكدة) أو الخروج على الهدف.
إذا كان LLR ≤ (\ln\frac {\beta} {1-\alpha}) → قبول (H_0) (لا ميزة) والتوقف.
خلاف ذلك، استمر في جمع الملاحظات.

حيثما كان ذلك مفيدا: عند تقييم الاستراتيجية «الحية/الميتة» في الحياة أو في ظل ظروف جديدة للترويج/المشاركة.

6) ثلاث «قواعد وقف» عملية (يمكن تطبيقها معًا)

1. حواجز النواتج (ت/ل):

حدد هدف الربح (+ T) وأوقف الخسارة (-L) مقدمًا، بما يتوافق مع الاحتمال المرغوب للنجاح (\mathsf {P}) (الصيغة في الفقرة 1). وصلنا إلى أحد الحواجز - المخرج.

2. قاعدة ثقة EV:

بعد كل كتلة من (ك)، أعد حساب احتمالية CI/Bayesian. إذا كانت الثقة في EV> 0 غير كافية (يتضمن CI 0 أو (\mathsf {P} (EV\le 0 )\ge\tau)) - توقف.

3. قاعدة مخاطر الخراب:

إذا كان RoR المشروط قبل نهاية الأفق ≥ (\beta) أو تم الوصول إلى حد السحب المسموح به (على سبيل المثال، 20٪ لنصف كيلي) - توقف، حتى لو لم يتم الوصول إلى الهدف.

7) آلات حاسبة صغيرة (ورق)

ألف - المباراة T/L لاستهداف معدل النجاح

أدخل درجة (p) (أو نطاق).

حدد الخطوة (\دلتا) والهدف (M = L/\Delta)، (N = T/\Delta).

احسب (\mathsf {P}) من الصيغة ° 1. تطابق (M, N) إلى (\mathsf {P }\ge P_{\text{target}}) (على سبيل المثال، 60٪).

أصلح الحواجز ولا تتغير على طول الطريق (وإلا فإن رياضيات التوقف تنهار).

باء - التحقق من ثقة المركبات الكهربائية (نهج التردد)

كل (ك) جولات، بناء 95٪ CIs لـ (p).

إعادة حساب EV مع مراعاة المدفوعات والعمولات.

إذا كان الحد الأعلى (للفرضية السلبية) أو الأدنى (للفرضية الإيجابية) من DI يتقاطع 0، توقف/استمر وفقًا للقاعدة 3.

جيم - الزناد البايزي

Prior (\text {Beta} (1.1)) (محايد) أو إعلامي.

بعد كل كتلة، قم بتحديث posteriori واقرأ (\mathsf {P} (EV\le 0)).

العتبة (\tau) تأخذ 0. 8–0. 9 للتوقف عن حزب المحافظين.

دال - خطر الخراب/التخفيض التدريجي

أسهم العمل من كيلي (و) (أفضل ⅓ - ½ كيلي).

حدد الحد الأقصى المسموح به للتخفيض إلى DD (_{\max}) (20-30٪).

إذا كان ≥ الحالي DD _{\max} DD (≥) أو RoR المشروط (\beta) (على سبيل المثال 5٪) - توقف.

8) السيناريوهات النموذجية والنماذج الجاهزة

السيناريو 1. المركبات الكهربائية الإيجابية، التقلبات العالية (الفتحات، المساحات الحرة)

(و/النهج) ⅓ كيلي ؛ الحواجز: (T = + 3\s\sigma) أرباح الجلسة، (L = -2\s\sigma).

كل 100-200 دوران هو شيك بايزي (\mathsf {P} (EV\le 0)).

أي من المحطات الثلاث تعمل - الخروج.

السيناريو 2. رهانات ميزة الاحتمالات

حواجز الربح/الخسارة في وحدات السعر (مثلاً) (T = + 10u)، (L = -6u).

SPRT с (\alpha = 0. 1 ،\\بيتا = 0. 2) بين (p_0) (لا ميزة) و (p_1) (متوقع).

سحب 20٪ من البنك هو توقف تقني.

السيناريو 3. اختبار استراتيجية جديد

رهانات صغيرة، وعاء اختبار محدود.

كل حدث (ك) - CI وفقًا لـ (p) ؛ إذا كان CI يتضمن صفر EV → قدم، راجع الفرضيات.

9) الأخطاء التي تكسر الإغلاق

حركة الحواجز («لنحرك المحطة مرة أخرى») - ضاع معنى الضمانات الاحتمالية.

تجاهل الارتباطات (السلسلة، الاعتماد على السوق) - إعادة تقييم عدد الاختبارات المستقلة.

تغيير حجم الرهان دون إعادة حساب القواعد - تغير التباين/المركبات الكهربائية، العتبات القديمة غير صالحة.

يعد التثبيت فقط على الربح بدون ثقة ومقاييس RoR فرصة كبيرة لـ «اللعب» للتخفيض غير الضروري.

10) خلاصة القول: صيغة عملية بسيطة

1. قبل البداية: حدد (T)، (L)، تردد البيريسترويكا (k)، العتبات (\tau) (لـ (\mathsf {P} (EV\le 0))، (\alpha ،\beta) (لـ SPRT)، DD ({\max})، (\beta {\tetext {ro R}}).

2. داخل اللعبة: بعد كل خطوة/كتلة، تحقق من المشغلات (الحواجز، ثقة المركبات الكهربائية، RoR/السحب).

3. إذا تم تشغيل أي محفز، توقف دون استثناء.

4. بعد الجلسة: log - إعادة الحساب (p، e ،\sigma)، تحديث العتبات.

إذا التزمت بهذه القواعد، فإن «لحظة التوقف عن طريق الاحتمال» تتحول من وقفة بديهية إلى قرار إداري صارم: توقف اللعبة بالضبط عندما تصبح فرصة التطور غير المواتي غير مقبولة إحصائيًا - وتحتفظ برأس المال وميزة للفرص التالية الأفضل.