ひよこい

競馬データの前処理・特徴量作成

スピード指数の作成

スピード指数とは スピード指数とは、全ての競走馬が同じ距離を同じ馬場状態で同じ負担重量で走った時の速さを数値化したものです。スピード指数は、競走馬の走破タイムとその競馬場の平均的な走破タイム(基準タイム)を比較し、これに騎手の重量や馬場状態...
競馬データの前処理・特徴量作成

競馬分析_基礎データの前処理②

クラスのデータ表記を統合 2021年より競馬業界のクラス表記が以下のように変わりました。 netkeibaで取得したデータも、2021年前後でクラスのデータ表記が変わっているため、2022年以降の新形式に統合します。また、オープンクラスは賞...
pyhon分析に向けた準備

ライブラリのインストール

ライブラリのインストール 競馬分析に必要な下記のライブラリをインストールします。pandasとはデータ解析を支援する機能を提供するPythonのライブラリです。 pandas pandasとはデータ解析を支援する機能を提供するPythonの...
pyhon分析に向けた準備

コードエディタのインストール

VScodeのダウンロード 公式サイトからVScodeをダウンロードします。Visual Studio Code の Download ページの Windows 用のリンクをクリックしてインストーラをダウンロードします。 VScodeのイン...
pyhon分析に向けた準備

pythonのインストール

Pythonのダウンロード 公式サイトからPythonをダウンロードします。Pythonの公式サイトを開きます。 ダウンロードのタブを選択する。 Python〇〇をダウンロードを選択する。 Pythonのインストール Add python....
競馬データの前処理・特徴量作成

クラス指数の作成

クラス指数とは クラス指数とはある拠点(競馬場・距離・フィールド)におけるクラスごとの競走馬の速さを指数化したものです。全く同一拠点であっても、G3レースやG1レースといったようにレースのクラスが違えば当然走破タイムも異なります。クラス指数...
競馬データの前処理・特徴量作成

距離指数の作成

距離指数とは 距離指数とは、異なる距離・異なるフィールド(芝・ダート)で走った競争馬の走破タイムを同じ基準で比較するための指数です。距離指数は「1÷基準タイム×100」で求められます。距離指数はクラスや競馬場は考慮せず、距離とフィールドのみ...
競馬データの前処理・特徴量作成

基準タイムの作成

基準タイムとは 競馬場、距離、フィールドごとに1~3着に入着した馬の平均タイムを指数化したものです。基準タイムよりどれくらい速いかでその馬の実力を測ることができます。基準タイムの算出条件はまちまちですが、当HPでは以下の条件で算出します。 ...
競馬データの前処理・特徴量作成

競馬分析_基礎データの前処理

日付のデータ型を変更 netkeibaよりスクレイピングしたレース結果において、日付は”2023年7月22日”という形(object型)で取得されます。この形ですとデータを扱いにくいため、2023-07-22の形(datetime64型)に...
競馬データのスクレイピング

馬情報のスクレイピング

ライブラリのimport 競馬データをスクレイピングするために必要な下記のライブラリをimportします。・pandas・re・BeautifulSoup・requests import pandas as pd import re fro...
PAGE TOP