昨年の秋くらいから機械学習などのAIに興味があり、関連するWebや本を読んだりしてます。
AIでなにをするのかというと、競艇、ボートレースの予測。
競艇がきっかけでAIに興味を持ち始めたのか、AIがきっかけで競艇で試してみようと思ったのか忘れてしまいましたが、なんだか安直な動機な感じではあります。
ちなみに競艇が趣味だったことは一度もなく、在職中だったころ競艇場や競輪場、地方競馬の饐えた雰囲気が好きでたまに帰宅途中や休日に行ってたくらいで舟券を買っても少額。なので全く詳しくない。
じゃ、なんで競艇なのかというと出走枠が6つしかないので予測しやすそうという点と毎日全国各地でレースをやってるので予測モデルを試しやすそうという点。
最初は機械学習で何をどうするのかまったく想像できなかったので、本やWebサイトを調べてましたが、微分や回帰分析、ベクトルなどの数学的な話は避けられないと感じ、ひと頃は機械学習というより数学の勉強が中心になってました。
で、機械学習に関する数学については(身についたかどうかは別にして)ひと段落したので、いざ実践ということでPythonでscikit-learnライブラリなどを使って…と思い始めたあたりで、他人の機械学習による競艇の予測なんかを見るとイマイチ結果が芳しくない雰囲気。
明らかに自分より機械学習をわかってそうな人でもこの程度なのかといった感じ。
まあ、選手のスペックはもちろん、レース当日の状況、使用するモーターの性能、フライングや転覆、落水など不確定要素が多く、機械学習で予測できるものなのかというそもそも論。
でもここで終わらせちゃうと趣味として面白くないので、ここは続ける前提で。
少なくとも、なんでもかんでも予測モデルにデータを突っ込んでもいい感じの予測ができるわけではなく、それなりに知識とセンスが必要なわけで、統計学も重要ではないかと思い始めて、いまは統計学の本を読んでます。
ただ本だけ読んでてもつまらないので、機械学習ではなく自分なりの予測ロジックを考えて、必要なデータをPythonでWebスクレイピングして予測・結果判定を自動化して眺めたりしてます。
さらに競艇についても遅ればせながらレースの特徴や買い方などを調べたり、Pythonも初心者なのでいろいろ格闘してます。
なお、競艇はあくまでも機械学習(または統計学)のネタで、高額配当を狙って一山当ててやろうとかいうのではなく、あくまでも予測モデルを作って検証してモデルを手直しするというプロセスをPythonや機械学習、統計学を使って楽しむという趣旨です。
もちろんそれなりに回収率が高いモデルができたらたまに舟券を買うかもしれませんが。