こんにちは。
ミルクおじさんです。
前回は、ナンバーズ4の基本統計量を示しました。
今回は、ロト6、ロト7、ミニロトを予想した同じ手法でナンバーズ4が予想できないか検証してみました。
数字が4つそれぞれ独立しているものを追えるかどうか?
楽しみです。
ではいってみましょう。
①Pythonにデータを読み込ませてモデルを作ります。
![](http://milkojisan.com/wp-content/uploads/2021/09/5f63f49b6b7d98988e1002a4a4f2d6d5-10.jpg)
![](http://milkojisan.com/wp-content/uploads/2021/09/04f86ea9c104d100d663feb8a9a65769-10-500x279.jpg)
![](http://milkojisan.com/wp-content/uploads/2021/09/63ead695680eb0c485fa3f134844052f-8-500x334.jpg)
![](http://milkojisan.com/wp-content/uploads/2021/09/0ae7c62e50dc705df75843b104ce66cd-8-500x336.jpg)
![](http://milkojisan.com/wp-content/uploads/2021/09/2839ab849d9b2c81bd86f4778e9767e3-8-500x353.jpg)
![](http://milkojisan.com/wp-content/uploads/2021/09/7d2a8a5d380f463388d1c8d4512bef57-6-500x301.jpg)
テストデータの決定係数がマイナスになってしまいました。
決定係数がマイナスになるのは計算次第ではありうるのですが、初めてのケースです。
データの数が少ないとマイナスになるケースがあるそうです。
②ランダムフォレストのハイパーパラメーターの最適化
![](http://milkojisan.com/wp-content/uploads/2021/09/40dcbe9d88c96297b642179a653642d8-5-500x373.jpg)
![](http://milkojisan.com/wp-content/uploads/2021/09/0dd4ffc683d3d0b0bf39d010daf3ee03-500x143.jpg)
訓練データの決定係数がかなり小さくなりました。テストデータの決定係数もマイナスに、、、。
やはりデータ数が足りないか、、、、。
③エクセルで予想した数字の検証
次に自己相関係数を利用して、予想した数字の検証を行います。
![](http://milkojisan.com/wp-content/uploads/2021/09/9d831d187199270f191b3999ca596311-3-500x435.jpg)
![](http://milkojisan.com/wp-content/uploads/2021/09/c64c5ece666a6407486987541305a212-1-500x369.jpg)
![](http://milkojisan.com/wp-content/uploads/2021/09/a402c696bf493a873c765923653c07e6-1-500x398.jpg)
④表にまとます。
![](http://milkojisan.com/wp-content/uploads/2021/09/78692eb8438a92f7e11a516981ad7fad-500x356.jpg)
ランダムフォレストの結果は、4と5が多いですね。
もしかしたら、あまりにもぶれていて、モデルの中で平均の数値を出しておいた方が無難だ
という答えが多いのかもしれません。
0を抽出できないのもそのためかもしれません。
このままだと3,4,5,6しか抽出できないかも。
ナンバーズ4恐るべし。
データ数を上げて検証しなおします。
⑤まとめ
今回は、ナンバーズ4の直近のデータを予想してみました。
データ数が少なくて、安定していないことがわかりました。
次回は、データ数を多くして予想します。
ではまた。