一个真实数据集的完整机器学习解决方案(下) (4)

一个真实数据集的完整机器学习解决方案(下)

可以看到,经过超参数寻优后确定的模型,相比较未寻优的模型,Mae降低了约10%,也就是说模型的预测精度上升了10%,这个改善幅度,对于超参数寻优来说,已经是一个不错的幅度了。

但对于这个寻优的过程来说,是需要花费一定的时间成本的,例如我们的这个寻优,相比原始的模型,花费了原始模型约10倍左右的时间,从1s不到到12s。这也说明了机器学习是一种“权衡游戏”,我们需要不断地平衡准确性与可解释性、偏差与方差、准确性与运行时间等表现。正确的组合是因问题而异的。

现在,我们已经有了最终超参调优后的模型,就可以使用该模型,来评估他们与真实值的偏差了,我们对于测试集,绘制预测值与实际值的密度图对比,以及预测值减去实际值所得到的残差hist图,来对模型的预测效果进行可视化的展示。

一个真实数据集的完整机器学习解决方案(下)

一个真实数据集的完整机器学习解决方案(下)

我们来分析一下这个可视化的结果:虽然模型预测值的密度峰值接近中值在66附近,而非真实值的100左右密度峰值,但模型预测值密度分布大致接近实际值密度分布。而模型预测值与真实值的残差分布,也是符合正态分布的。

最后,这个结果说明了,我们构建的梯度提升回归机器学习模型,能够较为准确的预测样本外的建筑物能源之星得分,达到了我们最初预测目标变量的这一实际目的。

那么,我们这个系列的文章(上篇、下篇)到这里全部结束了,感谢耐心读完长文的粉丝,技术宅真诚的希望,通过自己的文字,让你有所收获有所得。

关注 “数量技术宅”不迷路,您的点赞、转发,是我输出干货,最大的动力

一个真实数据集的完整机器学习解决方案(下)

 

一个真实数据集的完整机器学习解决方案(下)

往期干货分享推荐阅读

一个真实数据集的完整机器学习解决方案(上)

如何使用交易开拓者(TB)开发数字货币策略

股指期货高频数据机器学习预测

如何使用TradingView(TV)回测数字货币交易策略

如何投资股票型基金?什么时间买?买什么?

【数量技术宅|量化投资策略系列分享】基于指数移动平均的股指期货交易策略

AMA指标原作者Perry Kaufman 100+套交易策略源码分享

【 数量技术宅 | 期权系列分享】期权策略的“独孤九剑”

【数量技术宅|金融数据系列分享】套利策略的价差序列计算,恐怕没有你想的那么简单

【数量技术宅|量化投资策略系列分享】成熟交易者期货持仓跟随策略

如何获取免费的数字货币历史数据

【数量技术宅|量化投资策略系列分享】多周期共振交易策略

【数量技术宅|金融数据分析系列分享】为什么中证500(IC)是最适合长期做多的指数

商品现货数据不好拿?商品季节性难跟踪?一键解决没烦恼的Python爬虫分享

【数量技术宅|金融数据分析系列分享】如何正确抄底商品期货、大宗商品

【数量技术宅|量化投资策略系列分享】股指期货IF分钟波动率统计策略

【数量技术宅 | Python爬虫系列分享】实时监控股市重大公告的Python爬虫

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/wsxxyd.html