확률로 멈추는 순간을 결정하는 방법
"확률로 멈추는 순간" 이 필요한 이유
중지는 바람직하지 않은 결과가 허용 가능한 임계 값을 초과하거나 반대로 목표를 달성했기 때문에 게임/세션을 중지하는 미리 정해진 이벤트입니다. 정서적 "충분히" 와 달리 확률 론적 중지는 다음에 의존합니다
1. 결과 장벽 (이익/결점);
2. 승률 추정치 (p, EV, 분산);
3. 위험 측정 (파멸의 위험, 잘못된 결론의 확률, 신뢰 구간);
4. 테스트 중지 (SPRT/베이지안 규칙).
1) 기본 모델: 2 개의 흡수 장벽 (대상 및 정지)
단계 (속도/라운드) 가 다양한 자본을 상상해보십시오: 확률 (p), 확률 (q = 1-p). 우리는 상위 (+ T) (이익 목표) 와 하위 (-L) (정지 손실) 의 두 가지 장벽을 소개합니다. 자본이 그들 중 하나에 도달하자마자 중지하십시오.
발 앞에서 목표에 도달 할 가능성 (클래스 "플레이어 파멸")
단계가 절대 값과 (p\ne q) 에서 동일하면 0에서 시작할 때 단계 목표 (N = T/\Delta) 와 (M = L/\Delta) 가 다운됩니다
[
\ matsf {P} {\tex는} + T} 에 도달합니다. = ;\frac {1- (q/p) ² {M}} {1- (q/p) ² {M + N}}
]지정법 (p = q = 0 {.} 5): (\matsf {P} =\frac {M} {M + N}).
규칙: 목표 성공률과 일치하도록 (T) 및 (L) 을 선택하십시오 (예: 60% 이상). 이것은 장벽에서 멈췄습니다. 우리는 레벨 중 하나에 도달했습니다.
실질적인 결론: 바람직하지 않은 경우 (p\le 0. 5) 대칭 목표와 발은 약 50% 의 성공을 거두었습니다. 장벽의 비대칭 (더 작은 정지, 더 큰 목표) 또는 실제 (EV> 0) 만 보상 할 수 있습니다.
2) 수평선 끝쪽으로 파멸의 위험에 처하십시오 (RoR)
은행 (B), 주식 (f), 라운드 변동성 (\시그마), 이점 (e) (라운드 당 예상 수익률) 이 있다고 가정 해 봅시다. 최종 수평선 (N) 의 경우 다음과 같은 관심이 있습니다. "임계 수준 (B _ {\min}) 아래로 떨어질 가능성은 무엇입니까?" 현재 드로우 다운 (DD) 의 조건부 RoR이 지정된 임계 값 (\베타) (예: 5%) 으로 확대되면 중지합니다.
휴리스틱 작업: Kelly에서 주식을 재생하는 경우 최대 허용 단점 (예: 반 켈리와 20-30%) 에 빠질 때 매개 변수가 복원 될 때까지 중지하십시오 (재 계산 (p, e ,\sigma), 감소 (f)).
3) 승리/확률에 대한 자신감 중지
실제 배당률 (p) 을 알 수 없으면 (슬롯, 라이브 마켓) 관찰 점수가 업데이트됩니다. (n) 시도에 대한 이진 추상화에 (w) "성공" 이 있도록하십시오. (p) (예: Clopper-Pearson) 에 대해 양면 95% CI를 구성하십시오. 실제 EV에 대한 CI 상한이 10을 떨어 뜨리면 규칙은 다음과 같습니다
역: (p) 에 대한 CI의 하한이 EV> 0을 만드는 임계 값을 초과하는 경우 가장 가까운 이익/시간 장벽을 계속 유지할 수 있습니다.
4) 베이지안 정지: "전기 확률 0"
(p) (베타 분포 (\텍스트 {Beta} (\alpha _ 0 ,\beta _ 0)) 이전) 을 설정합니다. (n) 시험에서 (w) "성공" 후, 후방 (\텍스트 {Beta} (\alpha _ 0 + w ,\beta _ 0 + n-w)). 가설 "(EV\le 0)" 의 후방 확률을 다시 계산하십시오 (보상 계수를 고려하여).
규칙: 이것이 (예를 들어, 80-90%) 입니다.
장점: 선험적 정보의 원활한 설명, 작은 샘플의 안정성.
5) 발트 순차 테스트 (SPRT) - "온라인 솔루션"
SPRT 테스트 (H _ 0) 대 (H _ 1) 는 각 결과 후에 즉시 테스트됩니다. 허용 가능한 오류를 설정합니다: (\alpha) (잘못된 경보) 및 (\beta) (이점을 건너 뛰기) 및 (p) 에 의한 두 가지 가설:- (H _ 0:; p = p _ 0) (경계가 EV 계수 0 인 경계), (H _ 1:; p = p _ 1) (예상 혜택).
로그 가능성 비율 (LLR) 이 고려됩니다.
규칙 중지:- (PHP 3 = 3.0.6, PHP 4)
- (PHP 3 = 3.0.6, PHP 4)
- 그렇지 않으면 계속 관측치를 수집하십시오
유용한 곳: 라이브 또는 새로운 프로모션/코프 조건에서 "라이브/데드" 전략을 평가할 때.
6) 세 가지 실용적인 "중지 규칙" (함께 적용 할 수 있음)
1. 결과 장벽 (T/L):- 원하는 성공 확률과 일치하여 이익 목표 (+ T) 와 정지 손실 (-L) 을 사전에 수정하십시오 (\matsf {P}) (§ 1의 공식). 우리는 장벽 중 하나 인 탈출구에 도달했습니다.
- (k) 라운드의 각 블록 후에 CI/베이지안 확률을 다시 계산하십시오. EV> 0에 대한 신뢰가 충분하지 않은 경우 (CI에는 0 또는 (\matsf {P} (EV\le 0 )\ge\tau) 가 포함됨) -중지됩니다.
- 수평선이 끝나기 전의 조건부 RoR이 확장 (\베타) 이거나 허용 가능한 결점의 한계에 도달하면 (예: 반 켈리의 경우 20%) -목표에 도달하지 않더라도 중지하십시오.
7) 미니 계산기 (용지)
A. T/L과 일치하여 성공률 목표
점수 (p) (또는 범위) 를 입력하십시오.
단계 (\델타) 와 대상 (M = L/\델타), (N = T/\델타) 을 선택하십시오.
공식 § 1에서 계산하십시오. 일치 (M, N) 와 (\matsf {P }\ge P _ {\텍스트 {대상}}) (예: 60%).
장벽을 고치고 길을 따라 변하지 마십시오 (그렇지 않으면 정지 수학이 고장남).
EV 신뢰도의 B. 검증 (주파수 접근)
모든 (k) 라운드는 (p) 에 대해 95% CI를 구성합니다.
지불 및 수수료를 고려하여 EV를 재구성하십시오.
DI의 상위 (음의 가설의 경우) 이하 (양의 가설의 경우) 경계가 0과 교차하는 경우 규칙 § 3에 따라 중지/계속하십시오.
C. 베이지안 방아쇠
(PHP 3 = 3.0.6, PHP 4)
각 블록 후에 후부를 업데이트하고 읽으십시오 (\matsf {P} (EV\le 0)).
임계 값 (\tau) 은 0입니다. 8–0. 보수적 인 정류장의 경우 9.
파멸/결손의 위험
Kelly (f) 의 근로 주식 (더 나은 경우 - ½ Kelly).
최대 허용 단점을 DD (_ {\max}) (20-30%) 로 설정하십시오.
(PHP 3 = 3.0.6, PHP 4) 5%) -중지
8) 일반적인 시나리오 및 기성품 템플릿
시나리오 1. 긍정적 인 EV, 높은 변동성 (슬롯, 프리 스핀)
(f\접근 방식) "켈리; 장벽: (T = + 3\s\sigma) 세션 이익, (L = -2\s\sigma).
100-200 스핀마다 베이지안 체크 (\matsf {P} (EV\le 0)) 가 있습니다.
세 정거장 중 하나라도 작동합니다-종료.
시나리오 2. 장점 베팅 확률
요율 단위의 이익/손실 장벽 (예: (T = + 10u), (L = -6u).
SPRT (\알파 = 0. 1 ,\\beta = 0. 2) (p _ 0) (이점 없음) 과 (p _ 1) (예상) 사이.
은행의 20% 를 삭감하는 것은 기술적 인 중지입니다.
시나리오 3. 새로운 전략 테스트
마이크로 베팅, 제한된 테스트 포트.
각 (k) 이벤트 - (p) 에 따른 CI; CI에 0 EV → 피트가 포함 된 경우 가설을 수정하십시오.
9) 셧다운을 중단시키는 실수
장벽의 움직임 ("다시 멈추자") -확률 론적 보장의 의미가 상실됩니다.
상관 관계 무시 (시리즈, 시장 의존성) - 독립적 인 테스트 수의 재평가.
규칙을 다시 계산하지 않고 베팅의 크기를 변경합니다. 분산/EV 변경, 이전 임계 값은 유효하지 않습니다.
자신감과 RoR 지표가없는 이익에만 맞추는 것은 불필요한 결점에 "재생" 할 가능성이 높습니다.
10) 결론: 간단한 프로세스 공식
1. 시작하기 전에: (T), (L), 페레스트로이카 주파수 (k), 임계 값 (\tau) (for (\matsf {P} (EV\le 0)), (\alpha ,\beta) (SPRT), DD ({\max}), (\베타 {\텍스트 {RoR}}).
2. 게임 내: 각 단계/차단 후 트리거 (장벽, EV 신뢰, RoR/드로우 다운) 를 확인하십시오.
3. 트리거가 트리거되면 예외없이 중지하십시오.
4. 세션 후: 로그-재 계산 (p, e ,\sigma), 임계 값 업데이트.
이러한 규칙을 준수하면 "확률로 멈추는 순간" 은 직관적 인 일시 정지에서 엄격한 관리 결정으로 바뀝니다. 불리한 개발 가능성이 통계적으로 용납 될 수 없을 때 정확하게 게임을 중단하고 자본과 이점을 유지합니다. 다음으로 더 나은 기회.
