如何分析獲勝系列
「獲勝系列」是兩個失敗者之間連續取得成功的結果(命中)。在公平的遊戲(獨立的後衛)中,該系列是自然的:隨機產生簇。有能力的系列分析有助於了解風險剖面(多少「去」)並設置限制。他沒有預測下一個旋轉。
1)基本模型: 伯努利和系列幾何形狀
讓每個旋轉是一個獨立的測試,具有成功的概率(p)(例如「任何收益」或「有意義的收益≥×10」)。
獲勝系列的長度(K\ge1)到第一次損失是幾何分布的:[
\mathbb{P}(K=k)=(1-p),p^{k-1},\quad \mathbb{E}[K]=\frac{1}{1-p},\quad \mathrm{Med}(K)\approx \left\lceil \frac{\ln 0.5}{\ln p}\right\rceil.
]≥ (k):(\mathbb {P} (K\ge)=p^{,k-1}系列概率)。
每個自旋(N)的預期序列數(所有長度)(N(1-p))。
每個自旋的(N)系列的預期長度為 (k) (N (1-p), p^{,k-1}。)
2)在您的日誌上精確測量什麼
首先確定要考慮的成功:- -「任何收益」(HF),或
- -「有意義」(閾值,例如≥×5/×10),或
- -「正旋轉」(付款≥費率)。
1.HF(評估(p)):成功旋轉的比例。
2.獲勝系列的長度列表:(K_1,K_2,\dots)(以及分別為「重要」)。
3.Quantili系列的長度:中位數,第75位,第90位。
4.最大系列(Max W-streak)在拉伸上(N)。
5.多個閾值(k)的序列≥ (k)數(例如,≥3、≥5)。
6.失敗系列(L-streak)的統計數據是對稱的,這對於後背的停止駝鹿很重要。
3)快速解釋數字
如果觀測到的頻率(#{K\ge} /#\text {seri}接近(p^{k-1}),則行為類似於獨立。
短樣本的偏差是規範。請參見不確定性間隔(按列表(K_i))和/或模擬排序)。
Max W-streak按對數生長(N):長的「美麗」系列甚至很小(p)。
迷你示例。令HF(p=0{}30)。然後:- (\mathbb{P}(K\ge3)=p^2=0{,}09);在(N=1000)上等待旋轉(\approx N(1-p)p^{2}\approx 630\times0{,}09\approx 57)≥3系列。對於≥6:(p^{5}\approx 0{,}00243)⇒ ≈(630\times0{,}00243\approx 1{,}5)系列-稀有,但不是奇跡。
4)假設驗證: 「系列沒有誇大嗎?」
使用一個或多個工具:1.與幾何的比較。
-估計(p =\widehat {HF}。)
-構造理論(\mathbb {P}(K\gek)=p^{k-1})並與經驗進行比較。
-為觀察到的份額添加信任條紋(butstrap)。
2.Wald-Wolfowitz測試(運行測試)。
-將背部歸類為成功/失敗。
-將「序列」(runs)數與獨立時的預期數進行比較。
-顯著偏差可能表明依賴性(或只是小樣本)。
3.蒙特卡洛為零。
-在固定(p)下,壓縮數千個長度(N)序列。
-查看Max W-streak分布和≥ (k)系列數。
-將您的觀察結果與此分布進行比較(p值「太不尋常或不尋常」)。
5)實踐: 如何制定計算(無代碼)
1.收集一個日誌:旋轉號,結果(乘數),二元標誌「成功」,「有意義的成功」。
2.在成功揚聲器上運行並形成序列長度(計數器,在未成功時重置為0)。
3.計算:- -(p=)成功標誌的平均值;
- -quantili (K);
- – Max W-streak;
- -(k=2..7)的頻率(#{K\gek}。
- 4.構造理論:(p^{k-1}和預期的≥ (k): (N (1-p) p^{k-1}系列)。
- 5.模擬零(至少10k運行)-Max W streak分布和≥ (k)系列數。
- 6.比較和結論:「在預期範圍內」/「高於預期,但在信任帶上」/「懷疑-缺乏數據」。
6)典型的陷阱
選擇性窗口選擇。采取了「成功」的時期-這些系列似乎是魔術。使用固定的窗口長度(例如,1000旋轉的蹦床)。
即時改變成功標準。首先確定「成功」是什麼,不要改變結果。
混淆「連勝」和「連勝」。這些是不同的二元化(HF vs「付款≥費率」)。
解釋為預測。這些系列描述了過去的圖案,而沒有報告下一個背面(獨立性)。
7)如何在風險管理中使用系列
背部限制。知道失敗系列(L-streak)的配額,設置「L≥k後超時」。
銀行計劃。如果中位數獲勝系列是短暫的,並且「有意義」是罕見的,則指望銀行獲得「沙漠」。
會話長度。遇到系列≥ (k)的概率隨著(N)的增長而增長。如果目標是「捕獲≥×10」,請通過計分(q =\mathbb {P} (\for spin} text{≥×10)),然後使用(\mathbb {P} (\text {not} N)=(1-q)^N)。
禁用狗狗。這些系列沒有提高利率的好處-它只是方差的一種形式。
8)針對您的文章/報告的迷你模板
成功標準: (任何收益/≥×10/優勢旋轉)
HF(估計(p)): ……%
W系列長度的配額: 中位數……;第75個……;90年代……
≥3/ ≥5/ ≥6系列數目: 事實./……/……;等待(N(1-p)p^{k-1})……/……
Max W-streak: 事實……;模擬範圍(Q5-Q95):……-……
結論:模型匹配/需要更多數據;關於限制的建議。
9)小地標(以校準直覺)
使用HF (p=0{}25): W系列中位數 ≈ 1-2, (\mathbb {P} (K\ge5)=p^{4}\approx 0{,}39%)。在(N=2000)自旋上等待≥5系列:(\approx 1500\times0{,}0039\approx 6)。
在罕見的事件中(q=1%)(例如≥×10):「有意義的系列」的中位長度為1(很少連續2+),並且這種自旋之間的距離較大;對「事件之間的暫停」的系列分析比「連續」更有用。
10)分析師短期支票清單
我清楚地記錄了成功的標準嗎?
窗口的長度和數據量是否足夠(蹦床,不止一次運行)?- 在相同的(p)下與幾何和蒙特卡洛進行了比較?
顯示了帶有置信條的quantili和Max W-streak?
調查結果是否涉及風險管理而不是「計時」利率?
結果:獲勝系列是隨機性的正常表現形式。它們的分析是處理幾何分布並將觀測結果與零模型(和/或模擬)進行比較,而不是「熱時鐘」的搜索。灰色數字-HF,長度配額,預期的系列數量和最大系列的分配-你武裝起來計劃銀行,會議時間和限制,保持誠實的數學而不是迷信。
