データの扱い
BR-STATで扱うデータは、すべてBOAT RACE公式が一般公開している情報です。 HTML取得ベースで収集し、取得した生データは削除しません。
データの加工・集計プロセスは再現可能な形で管理しており、 同じ入力からは常に同じ出力が得られる冪等性を確保しています。
記事の基準
BR-STATにおける記事は「データから導いた研究ノート」です。感想文ではありません。
- 主張にはデータの裏付けが必要
- サンプル数と集計期間を必ず明記
- 個人的な予想・推測は記載しない
記事作成プロセス
- データがある — 集計可能なデータが存在することが前提
- 問いを立てる — データから検証可能な仮説・疑問を設定
- 集計する — 条件を明示したうえでデータを集計
- 結果を解説する — 集計結果を客観的に説明
- 例外を記載する — 統計の限界や例外条件を併記
- 関連リンクを設置する — 関連する統計ページや記事へ誘導
統計の透明性
BR-STATが公開する統計データには、以下の情報を必ず付記します。
- サンプル数(nの明記)
- 集計期間(開始日〜終了日)
- 集計条件(フィルタ・除外条件)
- データソースの明示
条件が不明な統計は掲載しません。読者が自ら検証できる状態を目指します。
例外の記載
統計には必ず限界があります。BR-STATでは、分析結果とともに 以下のような例外条件を必ず併記します。
- サンプル数が少ない場合の注記
- 特定条件下でのみ成立する傾向の明示
- 外れ値や異常データの扱い方の説明
- 因果関係と相関関係の区別
AI予測の姿勢
AI予測モデルの精度は隠しません。 現在の精度、過去の精度推移、そしてリーク検出の過程も公開します。
モデルの限界を正直に示すことが、 予測結果の信頼性を担保する唯一の方法だと考えています。