ひよこい

競馬データの前処理・特徴量作成

騎手勝率

競馬における騎手 競馬のレース結果において、馬の能力が7割、騎手の能力が3割といわれるほど、勝敗に騎手の影響は強くかかわっています。このため、騎手に関連した特徴量を競馬の予想モデルに組み込むことは精度向上に不可欠です。ここでは、騎手勝率を特...
競馬よもやも話

競馬予想モデルと狙うべき馬券

競馬は確率論とデータ分析を駆使した予想の世界です。予想モデルを作成する際、どの馬券を狙うべきかは、予想モデルの精度や還元率(ブックメーカーや競馬場が取る手数料)を考慮する必要があります。今回は、LightGBMなどの機械学習モデルを用いた競...
競馬データの前処理・特徴量作成

馬年齢(日齢)と日齢を使った派生特徴量

競馬紙やnetkeibaの馬柱では馬年齢は年齢で記載されていることがほとんどです。馬の年齢をより正確に、かつ詳細に表現するために、日齢を特徴量として使用する方法を取り入れることが有効です。以下では、馬の年齢(日齢)を特徴量として使う方法と、...
競馬よもやも話

予想モデルの改良タイミング

lightGBMで予想モデルを作成した後、どのようなタイミングで予想モデルの改良を行えば良いだろうか?例えば競馬予想モデルを作成し、そのモデルの的中率が20%(5回に1回当たる)である場合を考える。そのモデルで使用して4回連続外れた場合、「...
競馬データの前処理・特徴量作成

前走とのフィールド距離の変化

競馬における「前走とフィールドの変化」を特徴量に活用する方法 前走と次走で「芝」と「ダート」が変わることは、馬にとって大きな変化となり、そのパフォーマンスに大きな影響を与えます。芝とダートは馬場の性質が大きく異なり、それぞれに適した馬の特性...
お知らせ

LightGBMを用いた競馬の着順予測(2値分類)

LightgGBMを用いた競馬の着順予測(2値分類) LightGBMを用いて競馬の着順予測する方法を紹介します。今回は2値分類を用いて、着順予測をする方法を説明します。2値分類は、最も基本的な分類の一つで、「YES/NO」や「1着になるか...
競馬データの前処理・特徴量作成

前走とのコース距離の変化

競馬における「前走とコース距離の変化」を特徴量に活用する方法 競馬の予測モデルで精度を高めるためには、今回のコース距離が前走のコース距離からどのように変化したかを分析することが有効です。コース距離変化(増加・減少)を特徴量として取り入れるこ...
lightGBMによる着順予測

競馬予想におけるlightGBM

予測対象の選択:勝ち馬予測かレースタイム予測か LightGBMで競馬予測を行う際のターゲット設定には、「その馬が1位になるかどうか」を予測する分類アプローチと、「馬の走破タイム」を予測する回帰アプローチの2つの方法があります。勝ち馬予測を...
競馬よもやも話

競馬で最適な賭け金額を見極める

競馬での賭け方を工夫すれば、限られた予算でリスクを抑えながら勝つ確率を上げることができます。特に注目すべきが、数学的根拠に基づく「ケリーの公式(Kelly Criterion)」です。この公式は、予算に対して最適な掛け金額を決めるための手法...
lightGBMによる着順予測

LightGBMとは

LightGBMとは light GBM(Light Gradient Boosting Machine)とは、機械学習における分析アルゴリズムであり、教師あり学習と呼ばれるデータ分析方法の一つです。lightgGBMは決定木と呼ばれる機械...
PAGE TOP