ボートレース統計研究所
5年分のレースデータを解析し、AIモデルの精度を完全公開する研究サイト。
予想ではなく、測定する。
288,120
総レース数
2021-2026
1,728,720
総サンプル数
出走表ベース
1,844
登録選手数
マスタ
56.9%
AI的中率
事前予測 (2026)
研究アプローチ
透明性
モデルのパラメータ、特徴量、学習データ範囲、評価指標をすべて公開。ブラックボックスにしない。
再現性
5年分28万レースのパイプラインは完全に再実行可能。同じデータ、同じコードで同じ結果が出る。
誠実性
情報リークを排除。レース前に取得可能な情報のみで予測。事後分析と事前予測を明確に分離。
現行モデル概要
データ設計
| 学習期間 | 2021-01 ~ 2024-12 |
| 検証期間 | 2025-01 ~ 2025-12 |
| テスト期間 | 2026-01 ~ |
| 学習サンプル | 約 125万 |
| 分割方式 | 時系列分割(リーク防止) |
モデル仕様
| アルゴリズム | LightGBM (binary) |
| 特徴量数 | 22 |
| 確率正規化 | Softmax (レース単位) |
| 情報リーク | 除去済み |
| バージョン | v2 (pre-race) |
情報リークに関する注記
初期検証では、実レース後に確定する進入コース・スタートタイミング情報を含む事後分析モデルで Top1 Accuracy 59.5% を確認しました。ただし、事前予測としての公平性を担保するため、 公開版の勝率はレース前に取得可能な情報のみで 再学習したモデル (v2) に基づきます。