勝利のストリークを分析する方法
「勝利連勝」は2つの失敗の間の連続した成功した結果(ヒット)です。フェアプレイ(独立したスピン)では、シリーズは自然である:ランダム性はクラスタを生成する。バッチの有能な分析は、リスクプロファイルを理解し、制限を調整するのに役立ちます。彼は次のスピンを予測してない。
1)ベースモデル: ベルヌーイとバッチジオメトリ
各スピンを成功の確率(p)を持つ独立したテストにしましょう(例えば「、任意の勝利」または「重要な勝利≥ × 10」)。
最初の損失の前の勝利連鎖(K\ge1)の長さは幾何学的に分布します:[
\mathbb {P} (K=K)=(1-p)、 p^{k-1} 、\quad\mathbb {E} [K] =\frac {1} {1-p} 、\quad\mathrm {Med} (K )\approx\lceil\frac {\ln 0。5} {\ln p }\right\rceil。
]一連の長さの確率≥ (k): (\mathbb {P} (K\ge k)=p^{、k-1})。
(N)スピン≈ (N (1-p))あたりの予想実行数(すべての長さ)。
(N)スピンあたりの≥ (k)系列の予想数≈ (N (1-p)、 p^{、k-1})。
2)あなたのログで正確に測定するもの
まず、成功を構成するものを決定します:- -「任意の勝利」(HF)、または
- -「signal」(しきい値、例≥ × 5/ × 10)、または
- -「プラススピン」(ペイアウト≥レート)。
1.HF (score (p)):成功したスピンの割合。
2.賞金リスト:(K_1,K_2,\dots)(別途-「重要」)。
3.バッチの長さの量子:中央、75番目、90パーセンタイル。
4.ライン上の最大Wストリーク(N)。
5.複数のしきい値(k)の実行回数≥ (k)(例:≥ 3、 ≥ 5)。
6.ストリーク統計(L-ストリーク)を失う-対称、これは背中のストップロスのために重要です。
3)速いディジットの解釈
観測された周波数(#{K\ge k }/#\text {series})が(p^{k-1})に近い場合、その振る舞いは独立した振る舞いに似ている。
短いサンプルの偏差は正常です。不確実性間隔(bootstrap by list (K_i))および/またはシミュレーションを参照してください。
Max W-streakは(N)で対数的に成長します。
Miniの例。HF (p=0{、}30)とする。次に:- (\mathbb {P} (K\ge3)=p^2=0{、}09);(N=1000)スピンで期待(\approach N (1-p) p^{2 }\approach 630\times0{、}09\approach 57) ≥ 3系列。≥ 6: (p^{5 }\approx 0{、}00243) ≈ (630\times0{、}00243\approx 1{、}5)系列はまれであるが奇跡ではない。
4)仮説テスト: 「エピソードが高すぎますか?」
次のツールの1つまたは複数を使用します:1.ジオメトリとの比較。
-レート(p =\widehat {HF})。
-理論(\mathbb {P} (K\ge k)=p^{k-1})を構築し、経験値と比較する。
-観測された分数の信頼バンド(ブートストラップ)を追加します。
2.Wald-Wolfowitzテスト(テスト実行)。
-成功/失敗として背部を分類して下さい。
-「実行」の数と独立時に期待される数を比較します。
-重大な偏差は依存性(または単に小さなサンプル)を示す可能性があります。
3.モンテカルロ・アンダー・ゼロ。
-(p)を固定して、長さ(N)の数千のシーケンスをシミュレートします。
-Max W-streak分布とバッチ数≥ (k)を見てください。
-あなたの観察をこの分布と比較してください(p値「あまりにも珍しいかどうか」)。
5)練習: 計算をする方法(コードなしで)
1.ログを収集します。バックナンバー、結果(乗数)、バイナリフラグ「成功」、「重要な成功」。
2.成功カラムを実行し、シリーズの長さを形成します(カウンタ、失敗した場合は0にリセット)。
3.計算する:- -(p=)平均成功フラグ。
- -Quantiles (K);
- -最高のW-streak;
- -(k=2)の周波数(#{K\ge k})。7).
- 4.理論を構築する:(p^{k-1})と期待される直列≥数(k): (N (1-p) p^{k-1})。
- 5.0のシミュレーションを行います(少なくとも10k実行)-Max W-streakの分布と直列≥の数(k)。
- 6.比較と結論:「期待の範囲内「/」期待以上ですが、信頼バンドに適合します「/」疑わしい-不十分なデータ」。
6)典型的なトラップ
選択的なウィンドウの選択。私たちは「成功した」期間を取りました-シリーズは魔法のように見えます。固定ウィンドウの長さを使用します(例えば、1000スピンバッチ)。
即座に成功基準を変更します。まず「成功」とは何かを決め、結果に応じて変化しない。
「勝利シリーズ」と「プラススピンシリーズ」の混乱。"これらは異なる二元化です(HFと"payout ≥ rate")。
予測としての解釈。シリーズは、次の背中(独立)について何も報告せずに過去のパターンを説明します。
7)リスク管理でバッチを使用する方法
後ろの限界。損失系列(L-streak)の分量を知ることで「、L ≥ kの後のタイムアウト」を設定する。
銀行の計画だ。勝利の中央値が短く「、意味のある」珍しい場合は「、砂漠」に銀行します。
セッションの長さ。一連の≥ (k)に遭遇する確率は(N)と増加する。目標が「キャッチ≥ × 10」の場合は、(q =\mathbb {P} (\text {≥ × 10 per spin})を評価し、(\mathbb {P} (\text {catch per} N)=(1-q)^N)を使用します。
Dogonを無効にします。シリーズはレートを上げるための利点を提供しません-これはちょうど一種の分散です。
8)あなたの記事/レポートのためのミニテンプレート
成功基準: (任意の勝利/≥ × 10/プラススピン)
HF(スコア(p)): ……%
W系列の長さの量子: 中央値……;第75回……;90番目の……
バッチ数≥ 3/ ≥ 5/ ≥ 6: 実際の……/……/……;待っています(N (1-p) p^{k-1})……/……/……
Max W-streak: 事実……;シミュレーション範囲(Q5-Q95):……-...
出力:必要とされるモデル適合/より多くのデータ;制限に関する推奨事項。
9)小さいランドマーク(直感を調整するため)
HF (p=0{、}25): W系列中央値≈ 1-2、 (\mathbb {P} (K\ge5)=p^{4 }\approx 0{、}39%)。(N=2000)スピンでは、≥ 5シリーズを待っています:(\approach 1500\times0{、}0039\approach 6)。
まれなイベント(q=1%)で(例えば、≥ × 10):「重大な一連の」=1の中央値(まれに2+行)、そしてそのようなスピン間の距離は大きい;バッチ解析は「連続」よりも「イベント間の一時停止」の方が有用です。
10)アナリストショートチェックリスト
私は明らかに成功のための基準を修正しましたか?
ウィンドウの長さとデータ量は十分ですか(バッチ、複数実行)?
同じ(p)の下の幾何学およびモンテカルロと比較されるか)?
自信バンドでクオンタイルとMax W-streakを示しましたか?
結論は「タイミング」率ではなく、リスク管理に関連していますか?
ボトムライン:勝利のストリークはチャンスの通常のフォームです。これらの解析は「、ホットクロック」を探すのではなく、幾何学的分布を用いて観測をnullモデル(および/またはシミュレーション)と比較している。"灰色の数字では、HF、長さの数量、予想される系列の数、最大系列の分布-銀行計画、セッション期間と限界のために、迷信ではなく正直な数学の枠組みの中に残っています。
