統計と一致履歴を予測に使用する方法
記事の容積測定テキスト
統計は確率の言語です。彼女は未来を「推測」するのではなく、直感よりもチャンスを評価するのに役立ちます。試合の歴史はデータの重要な部分ですが、小さなサンプル、「パーソナルミーティングの魔法」、カレンダー効果、チームの形状など、間違って解釈するのは簡単です。以下は、合理的な係数を取得し、値を見つけるような方法で統計を収集し、クリーンにし、適用する方法についての実用的なガイドです。
1)どんなデータが本当に役に立つのか
基本的なコマンドメトリック
結果:勝利/引き分け/損失、ゴール/ポイント差。
「Quality of moments」:サッカーのxG/xGA、ホッケーのためのショット品質/期待される目標、バスケットボールの攻撃的/防御的評価。
テンポ/スタイル:所持、攻撃のペース、過渡期、圧力、3PA/pace (NBA)。
標準的な規定、コーナー、ペナルティ(サッカー):多くの場合、得点のチャンスの過小評価ソース。
個々の要因
リスト:傷害、懸濁液、回転、分の限界、指導者のリターン。
相乗効果と役割:誰が瞬間を作成します。、誰が変換します。、誰が保護を描画します。。
コンテキスト
ホーム/離れて、フライト、カレンダー密度(NBAでバックツーバック、サッカーで7日で3ゲーム)。
天候/表面/高度(風と雨はテンポと正確さを減らします)。
審判/審判(ホイッスルスタイルはファウルとペナルティに影響します)。
モチベーション/トーナメントポジション(ただし、数字のない「物語」には注意してください)。
2)対面ミーティングの歴史: それが重要なときとそれが罠であるとき
次の場合に便利です:- スタイルは「一致しない」:チームAは高圧に負け、対戦相手BはPDDAのリーダーの1人です。
- 安定したコーチとチームの中核、戦術はほとんど変化しませんでした、試合は最近でした(≤ 12-18ヶ月)。
- 反復可能なパターンがあります(例えば、相手のための大量の標準は、体系的に特定の防御に対してxGを作成します)。
- 古代の試合や他のコーチ/ラインナップ=ゴミ箱。
- 小さいサンプル:2-4ゲームは騒音です。
- メートル法確認なしの「ダービー心理学」。
実践:新鮮なデータ(フォーム、xGトレンド、コンポジション)と真っ先に矛盾する場合-新鮮なプロセスメトリックを信頼し、古い結果ではありません。
3)長期的で新鮮なデータの重量を量る方法
スライディングウィンドウ:最後の10-15マッチをフォームベースとして取ります。
減量: 最近のゲーム-より多くの重量(例えば、1。0 → 0.9 → 0.8…).
Ajast対戦相手:対戦相手の強さの統計を調整します(トップ5と部外者に対するゲームは「そのまま」平均することはできません)。
4)電力評価(Elo/ベンチマーク)
アイデア:各チームには評価が与えられます。試合の後、それは結果の驚きと試合の重要性を考慮に入れて、上昇/落ちる。
長所:汎用性、いくつかのパラメータ、良いベースラインを提供します。
応募方法:1.完成したEloをビルド/使用します。
2.サッカーでホームファクター(多くの場合≈+0を調整します。20–0.モデルの30の目標;バスケットボールで-ポイントで別のオフセット)。
3.格差→物流機能を通じて勝つ確率を翻訳します。
4.市場で確認してください:確率>暗黙は潜在的な値です。
5)単純な確率モデル: サッカーの例(ポアソン)
タスク:正確なスコアと結果の可能性を評価します。
ステップ:1.チームの予想される目標(\lambda_A)と(\lambda_B)を評価する(例:xGから防御/攻撃力とホームファクターのために調整)。
2.ヘッドディストリビューションの独立性を想定します(簡略化、しかし、開始するために働く)。
3.チームの得点(k)目標の確率:- (P (K=k)=e^{-\lambda }\frac {\lambda^k} {k!})。
- 4.「P1/X/P2,」合計の確率と正確なカウントを得るために分布を折りたたみます。
- Let (\lambda_A=1{、}55)、 (\lambda_B=1{、}10)。
- (P_A (0)=e^{-1。55 }\approx 0{、}212)、 (P_A (1 )\approx 0{、}329)、 (P_A (2 )\approx 0{、}255)。
- (P_B (0)=e^{-1。10 }\approx 0{、}333)、 (P_B (1 )\approx 0{、}366)、 (P_B (2 )\approx 0{、}201)。
- 折りたたみ(すべてのkに対して乗算および集計)により、結果と合計の確率(例えば、(P (\text {TB} 2{、}5))-すべてのペアの和(k_A+k_B\ge3))を得る。
- 「0-0」と描画します(得点されたゴールの相関は、純粋なPoissonでの描画頻度を減らします-描画要因を導入できます)。
- レッドカード、後半目標、マッチアップスタイル(ペースと基準は配布に影響します)。
6)「可算」ではなく「プロセス」評価の構築"
なぜ「xGはスコアよりも優れている」:スコアは離散合計であり、xGはモーメントの品質の合計です。チームは「生成」することができます2。0 xGでスコアは「悪いフォーム」ではなく、分散です。
アプローチ:- xGを構築する− xGのためにウェイトを減らすことでトレンドに対して。
- 相手(アジャスト相手)の強さを調整します。
- 生のスコアとマッチして、市場で買われ過ぎ/売れ過ぎのチームを特定します。
7)データからベットまで: ステップバイステップのフレームワーク
1.コレクションとクリーニング
最後の10-15ゲーム+シーズン平均。
ラインナップ、傷害、審判、天候、カレンダー。
明らかなアウトリアー(60分間の少数派でプレーするなど)を削除するか、マークを付けます。
2.強度評価
Elo/Power Rating+ホームファクター。
ajast相手とのxGトレンド(またはスポーツの同様の指標)。
3.モデルを一致させる
サッカーの場合:(\lambda_A 、\lambda_B)→Poisson;バスケットボール-テンポ+eFG%+ORB/TO→ポイント予測;テニスの場合-ドロー/ゲーム/セット確率モデル。
10〜5万のモンテカルロの反復をシミュレートし(できれば)、結果/合計/オッズの分布を取得します。
4.ラインとの比較
係数→暗黙的確率(p_\text{imp}=1/k)。
(p_\text{vasha}> p_\text{imp})が値の候補である場合。
エッジのサイズを推定する:(\text {edge}=p_\text{vasha}-p_\text{imp})。
5.ベットのサイズとリスク
初心者のための:定額料金0。5-1.銀行の5%。
セミケリー、確率のキャリブレーションに自信がある場合。
6.会計と検証
ジャーナル:日付、市場、コピー、(p_\text{vasha})、金額、結果、コメント。
ウィークリー:確率キャリブレーション(10%バケット:60%のスコアを持つレートから≈60%)。
A/Bテスト:xGモデルの"アカウントで"対"のベットの結果を比較します。
8)数値を変える定性的要因
マッチアップとスタイル。弱いアーク防御、相手に多くの3PAを与えるチームに対して、遅いフルバック、ピックアンドロールに対する高速側面。
過大評価"勝利のシリーズ。"多くの場合、それはカレンダー+運(PDO/変換/保存)です。プロセスメトリクスによる堅牢性のテスト。
回転と疲労。バックツーバックとロングトリップにより、攻撃効率と防御力が低下します。
9)ミニチェックリスト
試合の前に
- ラインナップとリーダーのステータスが更新されました
- 明らかにされたホームファクター、天候/適用範囲/審判
- 再計算(\lambda)/評価/確率
- ブックメーカーのラインとマージンとの比較
- 説明可能な値があります(なぜ市場が間違っているのですか?)
試合終了後
- ログを更新しました(参照、(p)、結果、xG/プロセス)
- 逸脱の原因が記録されました(15日の傷害、赤、ペナルティ、「ゴミの時間」)
- キャリブレーション:55%は実際に≈55%になりますか?
10)頻繁な間違いとそれらを回避する方法
頭から頭への再訓練。解決策:H2H重量制限と制限の法令。
証拠金及び市場は無視する。解決策:常にカウント(p_\text{imp})とエッジを探します、ない「勝者を予測」。
小さいサンプル。ソリューション:季節平均+減少重みをサポートします。
バリデーションはありません。ソリューション:キャリブレーションカーブ、バックテスト、ログ。
(1)プロセスメトリック(xG、品質評価)、(2)コンテキスト(ホーム/アウェイ、カレンダー、レフリー、天気)のデータを調整し、(3)予測を確率に変え、ラインとマージンと比較し、(4)規律ある方法でリスクを管理し、ジャーナルを保持します。「マッチ履歴」は神話のセットではなくなり、真の価値を見つけるためのツールに変わります。