こんにちは。
ミルクおじさんです。
前回は、日にちをミスってしまいすみません。
今度からは、気を付けます。
さて、気を取り直して次のロト6の予想をしていきましょう。
そういえば、Pythonのランダムフォレストのパイパーパラメーターの最適化をしていなかったので、
今回は、ランダムフォレストを最適化して予想してみます。
それでは、いってみましょう。
①データをPythonに入れて、モデルを作ります。
・データは、2020年10月1日~2021年9月16日を使用します。
②ランダムフォレストのハイパーパラメーターを最適化します。
普通のランダムフォレストよりも訓練データの決定係数が小さくなり、テストデータの決定係数の方が大きくなりました。
これは、普通のランダムフォレストの方が過学習だったことを示しています。
③エクセルで予想したデータを検証します。
④予想数字を表に示します。
今回、抽出された数字のセルを青色に着色します。
エクセルと普通のランダムフォレストで予想した数字、最適化したランダムフォレストで予想した数字を並べます。
抽出した数字を3種類に分けました。
抽出数字①:Excel、普通のランダムフォレスト(rf)および最適化したランダムフォレスト(rf_gcv)の数字が一致したもの
抽出数字②: Excelおよび普通のランダムフォレスト(rf)が一致したもの
抽出数字③: Excelおよび最適化したランダムフォレスト(rf_gcv)の数字が一致したもの
ここからのさらなる抽出は、己の勘を信じるのみですね(笑)
⑤まとめ
今回は、ランダムフォレストの最適化を通してロト6の予想をしてみました。
なんとか当選数字に近づけるように頑張りますので、お付き合いのほどよろしくお願いいたします。
では、また。
*⑥結果追記(9/20)
おつかれさまです。
本日の結果を記載します。
数字4個を抽出できた結果ですが、まだまだ精進が必要ですね。
*予想の時に項目Cの数字6の35のセルに着色忘れました。すみません。
ロト6 vs 機械学習の対決をお楽しみに。
ではまた。