ボートレース統計研究所

5年分のレースデータを解析し、AIモデルの精度を完全公開する研究サイト。
予想ではなく、測定する。

288,120
総レース数
2021-2026
1,728,720
総サンプル数
出走表ベース
1,844
登録選手数
マスタ
56.9%
AI的中率
事前予測 (2026)

研究アプローチ

透明性

モデルのパラメータ、特徴量、学習データ範囲、評価指標をすべて公開。ブラックボックスにしない。

再現性

5年分28万レースのパイプラインは完全に再実行可能。同じデータ、同じコードで同じ結果が出る。

誠実性

情報リークを排除。レース前に取得可能な情報のみで予測。事後分析と事前予測を明確に分離。

現行モデル概要

データ設計

学習期間2021-01 ~ 2024-12
検証期間2025-01 ~ 2025-12
テスト期間2026-01 ~
学習サンプル約 125万
分割方式時系列分割(リーク防止)

モデル仕様

アルゴリズムLightGBM (binary)
特徴量数22
確率正規化Softmax (レース単位)
情報リーク除去済み
バージョンv2 (pre-race)

情報リークに関する注記

初期検証では、実レース後に確定する進入コース・スタートタイミング情報を含む事後分析モデルで Top1 Accuracy 59.5% を確認しました。ただし、事前予測としての公平性を担保するため、 公開版の勝率はレース前に取得可能な情報のみで 再学習したモデル (v2) に基づきます。