如何分析获胜系列
"获胜系列"是两个失败者之间连续取得成功的结果(命中)。在公平的游戏(独立的后卫)中,该系列是自然的:随机产生簇。有能力的系列分析有助于了解风险剖面(多少"去")并设置限制。他没有预测下一个旋转。
1)基本模型: 伯努利和系列几何形状
让每个旋转是一个独立的测试,具有成功的概率(p)(例如"任何收益"或"有意义的收益≥×10")。
获胜系列的长度(K\ge1)到第一次损失是几何分布的:[
\mathbb{P}(K=k)=(1-p),p^{k-1},\quad \mathbb{E}[K]=\frac{1}{1-p},\quad \mathrm{Med}(K)\approx \left\lceil \frac{\ln 0.5}{\ln p}\right\rceil.
]≥ (k):(\mathbb {P} (K\ge)=p^{,k-1}系列概率)。
每个自旋(N)的预期序列数(所有长度)(N(1-p))。
每个自旋的(N)系列的预期长度为 (k) (N (1-p), p^{,k-1}。)
2)在您的日志上精确测量什么
首先确定要考虑的成功:- -"任何收益"(HF),或
- -"有意义"(阈值,例如≥×5/×10),或
- -"正旋转"(付款≥费率)。
1.HF(评估(p)):成功旋转的比例。
2.获胜系列的长度列表:(K_1,K_2,\dots)(以及分别为"重要")。
3.Quantili系列的长度:中位数,第75位,第90位。
4.最大系列(Max W-streak)在拉伸上(N)。
5.多个阈值(k)的序列≥ (k)数(例如,≥3、≥5)。
6.失败系列(L-streak)的统计数据是对称的,这对于后背的停止驼鹿很重要。
3)快速解释数字
如果观测到的频率(#{K\ge} /#\text {seri}接近(p^{k-1}),则行为类似于独立。
短样本的偏差是规范。请参见不确定性间隔(按列表(K_i))和/或模拟排序)。
Max W-streak按对数生长(N):长的"美丽"系列甚至很小(p)。
迷你示例。令HF(p=0{}30)。然后:- (\mathbb{P}(K\ge3)=p^2=0{,}09);在(N=1000)上等待旋转(\approx N(1-p)p^{2}\approx 630\times0{,}09\approx 57)≥3系列。对于≥6:(p^{5}\approx 0{,}00243)⇒ ≈(630\times0{,}00243\approx 1{,}5)系列-稀有,但不是奇迹。
4)假设验证: "系列没有夸大吗?"
使用一个或多个工具:1.与几何的比较。
-估计(p =\widehat {HF}。)
-构造理论(\mathbb {P}(K\gek)=p^{k-1})并与经验进行比较。
-为观察到的份额添加信任条纹(butstrap)。
2.Wald-Wolfowitz测试(运行测试)。
-将背部归类为成功/失败。
-将"序列"(runs)数与独立时的预期数进行比较。
-显著偏差可能表明依赖性(或只是小样本)。
3.蒙特卡洛为零。
-在固定(p)下,压缩数千个长度(N)序列。
-查看Max W-streak分布和≥ (k)系列数。
-将您的观察结果与此分布进行比较(p值"太不寻常或不寻常")。
5)实践: 如何制定计算(无代码)
1.收集一个日志:旋转号,结果(乘数),二元标志"成功","有意义的成功"。
2.在成功扬声器上运行并形成序列长度(计数器,在未成功时重置为0)。
3.计算:- -(p=)成功标志的平均值;
- -quantili (K);
- – Max W-streak;
- -(k=2..7)的频率(#{K\gek}。
- 4.构造理论:(p^{k-1}和预期的≥ (k): (N (1-p) p^{k-1}系列)。
- 5.模拟零(至少10k运行)-Max W streak分布和≥ (k)系列数。
- 6.比较和结论:"在预期范围内"/"高于预期,但在信任带上"/"怀疑-缺乏数据"。
6)典型的陷阱
选择性窗口选择。采取了"成功"的时期-这些系列似乎是魔术。使用固定的窗口长度(例如,1000旋转的蹦床)。
即时改变成功标准。首先确定"成功"是什么,不要改变结果。
混淆"连胜"和"连胜"。这些是不同的二元化(HF vs"付款≥费率")。
解释为预测。这些系列描述了过去的图案,而没有报告下一个背面(独立性)。
7)如何在风险管理中使用系列
背部限制。知道失败系列(L-streak)的配额,设置"L≥k后超时"。
银行计划。如果中位数获胜系列是短暂的,并且"有意义"是罕见的,则指望银行获得"沙漠"。
会话长度。遇到系列≥ (k)的概率随着(N)的增长而增长。如果目标是"捕获≥×10",请通过计分(q =\mathbb {P} (\for spin} text{≥×10)),然后使用(\mathbb {P} (\text {not} N)=(1-q)^N)。
禁用狗狗。这些系列没有提高利率的好处-它只是方差的一种形式。
8)针对您的文章/报告的迷你模板
成功标准: (任何收益/≥×10/优势旋转)
HF(估计(p)): ……%
W系列长度的配额: 中位数……;第75个……;90年代……
≥3/ ≥5/ ≥6系列数目: 事实./……/……;等待(N(1-p)p^{k-1})……/……
Max W-streak: 事实……;模拟范围(Q5-Q95):……-……
结论:模型匹配/需要更多数据;关于限制的建议。
9)小地标(以校准直觉)
使用HF (p=0{}25): W系列中位数 ≈ 1-2, (\mathbb {P} (K\ge5)=p^{4}\approx 0{,}39%)。在(N=2000)自旋上等待≥5系列:(\approx 1500\times0{,}0039\approx 6)。
在罕见的事件中(q=1%)(例如≥×10):"有意义的系列"的中位长度为1(很少连续2+),并且这种自旋之间的距离较大;对"事件之间的暂停"的系列分析比"连续"更有用。
10)分析师短期支票清单
我清楚地记录了成功的标准吗?
窗口的长度和数据量是否足够(蹦床,不止一次运行)?- 在相同的(p)下与几何和蒙特卡洛进行了比较?
显示了带有置信条的quantili和Max W-streak?
调查结果是否涉及风险管理而不是"计时"利率?
结果:获胜系列是随机性的正常表现形式。它们的分析是处理几何分布并将观测结果与零模型(和/或模拟)进行比较,而不是"热时钟"的搜索。灰色数字-HF,长度配额,预期的系列数量和最大系列的分配-你武装起来计划银行,会议时间和限制,保持诚实的数学而不是迷信。
