競馬紙やnetkeibaの馬柱では馬年齢は年齢で記載されていることがほとんどです。馬の年齢をより正確に、かつ詳細に表現するために、日齢を特徴量として使用する方法を取り入れることが有効です。以下では、馬の年齢(日齢)を特徴量として使う方法と、その派生する特徴量について説明します。
馬年齢(日齢)の作成
まず、馬の年齢を「年」ではなく「日齢(生まれてからの経過日数)」となるようにデータを加工します。日齢の計算方法は単純で以下になります。
日齢の計算方法
- 日齢 = 今日の日付 – 馬の誕生日
- 例:誕生日が2020年5月1日、今日が2024年11月27日であれば、その馬の日齢は「2024年11月27日 – 2020年5月1日」になります。
これにより、馬の年齢を非常に細かく扱うことができ、年齢の影響をより正確に捉えることができます。
年齢・日齢を使った派生特徴量
年齢別成績
馬の年齢別に「勝率」や「平均着順」などを算出し、年齢ごとの成績を特徴量として加えます。例えば、2歳の馬が過去に何レースして何回1着を取ったか、そしてその後、年齢とともにどのように変わっていったかといった情報です。これにより、年齢と勝率の変化からパフォーマンスが高い馬を識別することが可能になります
スタミナ指数
馬の年齢(日齢)と体重変化・成績等から適切なスタミナ指数曲線を作成します。このスタミナ指数曲線を用いて、各競走馬のスタミナ量を数値化することで、スタミナ量を比較することができます。
成長予測
馬は年齢とともに成長するため、前回のレースからどれだけの日数が経過したかを考慮することは重要です。前回レースで好成績を残した馬であっても、次回のレースまでに日数が短ければ、前回レースからの能力の向上は期待できません。一方で前回レースで能力が低かった馬も、前回レースから日数が経過していれば、能力の向上が期待でき、前回レースから想定できない結果を残すことがあります。
このため、成長予測を特徴量として取り入れるのは重要です。
成長予測は過去の膨大な競走馬のデータ(日齢、成績等)を用いて、成長曲線のパラメータ作成し、曲線をもとに今レースでの能力を算出し特徴慮量とします。
以上の通り、日齢を特徴量として加えることで、競走馬の成長過程やパフォーマンスの変化を精緻に捉え、レース結果の予測精度を向上させることが可能となります。
投稿者プロフィール
-
独学でpythonを学び競馬予測しています。これまでの競馬成績は以下の通り。回収率150%を目指します。
2021年回収率:119%
2022年回収率:104%
2023年回収率:121%
2024年回収率:88%
最新の投稿
- 競馬データの前処理・特徴量作成2024年12月30日騎手勝率
- 競馬よもやも話2024年11月28日競馬予想モデルと狙うべき馬券
- 競馬データの前処理・特徴量作成2024年11月27日馬年齢(日齢)と日齢を使った派生特徴量
- 競馬よもやも話2024年11月24日予想モデルの改良タイミング