【競馬予想AI作成①】データ収集
さて、複勝転がしは連敗が続いておりますが、いよいよ本題に着手しました。
今後使用するデータについてですが、以下の3つを候補として検討した結果、
JRDBに登録すると取得できるデータを使用することに決定しました。
③JRDB
選定理由は、
1.Windows以外の環境でも使用可能
2.データの種類が豊富
3.データ競馬で有名な人が使用していた実績あり
の3つです。
そして、JRDBのデータ取得については、283cks氏が公開してくださっているツールを使用してcsv出力させました。
※作成者の方には大変感謝しております。ありがとうございました。
こちらのツールを使用すると日付単位でcsvファイルが出力されますので、あとはそれらを結合してまとめるというところまでが本日行った作業です。
次はいよいよ使用するデータ項目の選定を行いたいと思います。
馬券の的中率計算用の関数実装
本日は今後実装予定のAIによって単勝支持率出した後に、それをベースに各馬券の的中率を計算する関数をPythonで実装した。本日実装したのは以下の5つ。
①複勝
②馬単
③馬連
④3連単
⑤3連複
実装した関数を2018年の有馬記念のデータで検証してみた。
単勝支持率は、「Mamba」が算出した予想勝率を使用する。
実装した関数での検証結果は以下の通り。
必要オッズ:1.22
実際のオッズ:1.2-1.4
必要オッズ:13.40
実際のオッズ:8.9
必要オッズ:8.04
実際のオッズ:6.3
必要オッズ:235.46
実際のオッズ:127.9
必要オッズ:62.57
実際のオッズ:36.1
実装としての問題は特になさそうである。
今回検証した馬券についてはほとんどが期待値1.0を下回る結果となり、
人気上位馬の馬券は「見」が正解だったということが分かった。
まずは計算用の関数が実装できたので、今後はいよいよ本題であるAIによる単勝支持率の予測に着手したいと思う。
複勝転がしの利確タイミングについて
現在チャレンジ中の複勝転がしについて、利確のタイミングをどうしようか検討中のためメモ代わりに残そうと思う。
今回は毎回の払戻金から数%ずつ利確する方法について検討を行った。
その結果が下のグラフである。
初期投資額は10000、複勝オッズは1.1倍(固定)として計算している。
これが複利の力である。
青線が利確を一切していないグラフ、赤線は毎回払戻金の3%を利確、橙線は毎回払戻金の5%を利確した時のグラフである。
ちなみにそれぞれの50回目と100回目の払い戻し金は以下の通り。
※50回連続成功は確率的にほぼ無理なのであくまで参考。
◆利確なし
50回目の払い戻し金:約117万
100回目の払い戻し金:約1億4000万
◆毎回3%利確
50回目の払い戻し金:約26万
100回目の払い戻し金:約660万
◆毎回5%利確
50回目の払い戻し金:約9万
100回目の払い戻し金:約82万
100回目の払い戻し金を見ると大きな差になっていることがわかる。
この結果から現在の方針としては、ある程度のところまで利確せずに進めようと考えている。
複勝転がしはいつか必ず連勝ストップが来るため、ちびちびと確実に利確するより少ない回数で大きく利益を出す方が得策な気がしている。
他にもいろいろと思いついた方法はあるが、それについては今後検討していきたい。
【番外編】複勝転がしチャレンジ 第二弾 ~1日目~
第一弾については3コロ目で終了という悲しい結末に終わりましたが、さっそく第二弾を開始しました。条件は同じで1万円スタートです。
本日の結果はこちらです。
とりあえず2コロ達成ということで第一弾に並びました笑
【総評】
データを眺めているとやはり過去の出走履歴が多い馬が出ているレースは的中率が高そうです(当然ですが)。特に今日は単勝支持率が最も高く且つその支持率が30%以上の馬の複勝率は100%でした。
今後もどんどんサンプル数を増やして分析してみようと思います。
【トータル収支】
第一弾:-10k
第二弾:-10k
合計:-20k
※含み益は利益に入れていません。
【本日の一句】
含み益 利確しなけりゃ ただの泡
【番外編】複勝転がしチャレンジ ~2日目~
結論から言います。
破産したのでチャレンジ終了です笑
今回のチャレンジは3コロ目で終了という結果になってしまいました。。
というわけで早速第2弾を開始したいと思います。
もちろん複勝転がしはいつかは外れるわけですが、サンプルが少なすぎてたまたま3コロ目で外れたのか、そもそもやり方が間違っているのか判断できないからです。
そしてもう一つ大事な要素である利確の方法についてもシミュレートしています。
そちらも含めて検証を継続しますので引き続きよろしくお願いします。
総評
今回は3歳未勝利戦でチャレンジ失敗となりましたが、そもそもAI予想を使っているため3歳などデータが少ない馬が多いレースは予想の根拠に乏しく、複勝転がしには適していないのではと考えています。第2弾では出走数が少ない馬が多いレースは避けてみようと思います。データは全レース取ろうと思っているので、どういった傾向が出てくるのか楽しみです。
【番外編】複勝転がしチャレンジ ~0日目~
AIを用いた予測モデルの構築にはそれなりの時間を要するため、その間番外編として複勝転がしチャレンジをしたいと思う。
方法についての詳細は伏せておくが、ある程度こうやればいけそうという考えはある。
まずは1万円スタートで、ここでは結果を報告したいと思う。
それではスタート!!