先々月から再開したPythonを用いた競艇予想の11月の結果です。
以前から書いてるとおり、予想モデルは下記の2つ。
・機械学習アルゴリズム
自作では、16レースに投票して420円獲得で-680円。7月以降トータルでは-220円で10月の+460円から再びマイナス圏へ転落。
一方の機械学習は、181レースに投票、24,430円獲得で+6,330円でしたが、10月末時点で-10,650円と大きくマイナスだったので7月以降トータルでは-4,220円でマイナス圏。
前回も書きましたが、予測についてのアイデアを検討すべく、Pythonでデータ収集スクリプトを作成して必要なデータを一箇所に集められるようにはしたんですが、これをどうやって使っていくかというところでちょっと足踏み状態です。
単純にアイデアを試すだけならいいんですけど、試した結果の検証方法を確立しないとトライ&エラーのサイクルが回せなくて闇雲にトライすることになりそう。
そこそこいい線いってるアイデアがあったとして、当たりやすい傾向と外れやすい傾向に目処をつけて投票対象を絞り込みたいときに、どのパラメータがその傾向に影響しているいるかを掴みたかったり。
地道に因果関係を見ていくのは面倒だし、なんとか自動化あるいは半自動化、自動化できなくても表やグラフなどで可視化できないものか。
相関係数とか特徴量選択とかをうまく使えばいいのかもしれないけど、ちょっとやってみた感触としては競艇の場合、これといった強い相関が見られるデータがあまりない気がするので、人力で複合的要素にある程度の当たりをつける必要があるんじゃないかと思ってます。
なかなか難しいですな。