AI精度検証

v2(メインモデル)とv3a(コースバイアス補正)の予測精度を比較します。

→ AIモデル比較ページ(スペック・設計思想の詳細)

モデル比較 (テスト期間: 2026年)

ModelTop1 AccLogLossBrier種別
ランダム16.67%---
常に1号艇54.96%0.37020.1108ベースライン
簡易モデル55.44%0.41930.1296参考
v2 事前予測 公開版56.88%0.40930.1263メイン
v3a コース補正 実験中55.49%0.34880.1052実験

v3aはv2のスコアにコースバイアス補正を加えたモデル。LogLoss・Brierで全モデル中最良。

主要指標 v2 vs v3a

Top1 Accuracy
v2
56.88%
vs
v3a
55.49%

AIが1着と予測した艇が実際に1着だった割合。

LogLoss
v2
0.4093
vs
v3a
0.3488

確率予測の対数損失。小さいほど確率推定が正確。

Brier Score
v2
0.1263
vs
v3a
0.1052

確率のキャリブレーション精度。0に近いほど良い。

月別 Top1 Accuracy

レース数v2v3a
26-015,34052.81%51.65%-1.16
26-024,20054.83%53.26%-1.57
26-033,16340.94%39.93%-1.01
26-045280%0%0.00

差はv3a − v2。正の値はv3aが優位。

予測枠番別 的中率

AIが1着に推した艇の枠番ごとの的中率。v2とv3aを並列表示。

1号艇
v2
49.72%
6001/12069
v3a
47.3%
6258/13231
2号艇
v2
37.02%
211/570
v3a
-%
0/0
3号艇
v2
37.57%
133/354
v3a
-%
0/0
4号艇
v2
28.18%
51/181
v3a
-%
0/0
5号艇
v2
34.21%
13/38
v3a
-%
0/0
6号艇
v2
47.37%
9/19
v3a
-%
0/0

Calibration (確率キャリブレーション)

モデルが出力した確率帯ごとに、実際の1着率を比較。理想は「30%と予測 → 実際に30%当たる」。

v2

確率帯件数実1着率
0-5%24,8671.97%-0.5%
5-10%18,4786.15%-1.4%
10-15%10,2579.94%-2.6%
15-20%5,55315.00%-2.5%
20-25%3,44318.30%-4.2%
25-30%2,51323.84%-3.7%
30-35%1,84027.34%-5.2%
35-40%1,48531.78%-5.7%
40-45%1,32538.26%-4.2%
45-50%1,37839.99%-7.5%
50-55%1,41646.33%-6.2%
55-60%1,65553.41%-4.1%
60-65%1,71555.80%-6.7%
65-70%1,61659.65%-7.9%
70-75%1,84565.64%-6.9%

v3a

確率帯件数実1着率
0-5%13,2592.64%+0.1%
5-10%22,6565.33%-2.2%
10-15%26,84710.02%-2.5%
15-20%3,34226.24%+8.7%
20-25%5162.75%+40.3%
35-40%20.00%-37.5%
40-45%32212.73%-29.8%
45-50%2,17926.98%-20.5%
50-55%3,59841.25%-11.3%
55-60%4,81455.88%-1.6%
60-65%2,31562.85%+0.4%
65-70%10.00%-67.5%

運用モデル

現在 v2(メインモデル)と v3a(実験モデル)の2モデル体制で運用中。 詳細はAIモデル比較ページをご覧ください。