AI精度検証

v2(メインモデル)とv3a(コースバイアス補正)の予測精度を比較します。

→ AIモデル比較ページ(スペック・設計思想の詳細)

モデル比較 (テスト期間: 2026年)

ModelTop1 AccLogLossBrier種別
ランダム16.67%---
常に1号艇54.54%0.37020.1108ベースライン
簡易モデル55.44%0.41930.1296参考
v2 事前予測 公開版56.88%0.40930.1263メイン
v3a コース補正 実験中55.49%0.34880.1052実験

v3aはv2のスコアにコースバイアス補正を加えたモデル。LogLoss・Brierで全モデル中最良。

主要指標 v2 vs v3a

Top1 Accuracy
v2
56.88%
vs
v3a
55.49%

AIが1着と予測した艇が実際に1着だった割合。

LogLoss
v2
0.4093
vs
v3a
0.3488

確率予測の対数損失。小さいほど確率推定が正確。

Brier Score
v2
0.1263
vs
v3a
0.1052

確率のキャリブレーション精度。0に近いほど良い。

月別 Top1 Accuracy

レース数v2v3a
26-015,34052.81%51.65%-1.16
26-024,20054.83%53.26%-1.57
26-033,16340.94%39.93%-1.01
26-045280%0%0.00
26-056000%0%0.00
26-065640%0%0.00

差はv3a − v2。正の値はv3aが優位。

予測枠番別 的中率

AIが1着に推した艇の枠番ごとの的中率。v2とv3aを並列表示。

1号艇
v2
45.73%
6001/13124
v3a
43.47%
6258/14395
2号艇
v2
33.6%
211/628
v3a
-%
0/0
3号艇
v2
34.91%
133/381
v3a
-%
0/0
4号艇
v2
25.25%
51/202
v3a
-%
0/0
5号艇
v2
33.33%
13/39
v3a
-%
0/0
6号艇
v2
42.86%
9/21
v3a
-%
0/0

Calibration (確率キャリブレーション)

モデルが出力した確率帯ごとに、実際の1着率を比較。理想は「30%と予測 → 実際に30%当たる」。

v2

確率帯件数実1着率
0-5%27,2711.79%-0.7%
5-10%20,0565.67%-1.8%
10-15%10,9899.28%-3.2%
15-20%6,00713.87%-3.6%
20-25%3,75816.76%-5.7%
25-30%2,72821.96%-5.5%
30-35%2,00725.06%-7.4%
35-40%1,61229.28%-8.2%
40-45%1,45034.97%-7.5%
45-50%1,49836.78%-10.7%
50-55%1,53442.76%-9.7%
55-60%1,77249.89%-7.6%
60-65%1,86051.45%-11.0%
65-70%1,75954.80%-12.7%
70-75%2,06958.53%-14.0%

v3a

確率帯件数実1着率
0-5%14,4422.42%-0.1%
5-10%24,7274.88%-2.6%
10-15%29,1109.24%-3.3%
15-20%3,63524.13%+6.6%
20-25%6152.46%+30.0%
35-40%40.00%-37.5%
40-45%35511.55%-31.0%
45-50%2,34525.07%-22.4%
50-55%3,88538.20%-14.3%
55-60%5,19151.82%-5.7%
60-65%2,61355.68%-6.8%
65-70%20.00%-67.5%

運用モデル

現在 v2(メインモデル)と v3a(実験モデル)の2モデル体制で運用中。 詳細はAIモデル比較ページをご覧ください。