Advertisement

python训练预测_如何使用随机森林来训练和预测模型?

阅读量:

我们如何使用random forest来预测模型?我想训练一个模型,最后使用three column dataset的random forest model in Python来预测一个真值(单击链接下载完整的CSV-数据集,格式如下所示t_stamp,X,Y

0.000543,0,10

0.000575,0,10

0.041324,1,10

0.041331,2,10

0.041336,3,10

0.04134,4,10

0.041345,5,10

0.04135,6,10

0.041354,7,10

我想使用X的最后一个数据点(例如:5、10、100、300、1000等等)预测{}的当前值(真值),使用sklearn中的random forest model。这意味着将X列的[0,0,1,2,3]作为第一个窗口的输入-我想预测Y的第五行值,该值是根据{}的先前值训练的。类似地,使用一个简单的rolling OLS regression model,我们可以按照下面的方法来做,但是我想用random forest model来实现。在

^{pr2}$

我用random forest解决了这个问题,它产生了df:t_stamp X Y X_t1 X_t2 X_t3 X_t4 X_t5

0.000543 0 10 NaN NaN NaN NaN NaN

0.000575 0 10 0.0 NaN NaN NaN NaN

0.041324 1 10 0.0 0.0 NaN NaN NaN

0.041331 2 10 1.0 0.0 0.0 NaN NaN

0.041336 3 10 2.0 1.0 0.0 0.0 NaN

0.041340 4 10 3.0 2.0 1.0 0.0 0.0

0.041345 5 10 4.0 3.0 2.0 1.0 0.0

0.041350 6 10 5.0 4.0 3.0 2.0 1.0

0.041354 7 10 6.0 5.0 4.0 3.0 2.0

.........................................................

[ 10. 10. 10. 10. .................................]

MSE: 1.3273548431

这对5、10、15、20、22的射程似乎很有效。但是,对于大于23的范围(它打印MSE: 0.0),这是因为,正如您从dataset中看到的,Y的值在第1-23行中是固定的(10),然后从第24行更改为另一个值(20,依此类推)。我们如何根据最后的数据点来训练和预测此类案例的模型?在

全部评论 (0)

还没有任何评论哟~