读书人

谈一下模型的选择

发布时间: 2012-11-26 11:48:50 作者: rapoo

谈谈模型的选择

在我们运用机器学习解决实际问题时,我们可能用得最多的套路就是找特征,选模型,扔进去训练。比如当我们面对{0,1}分类问题时,我们可能很自然的就想到了逻辑回归来解决,但是这个看似自然的做法背后又是怎么得来的呢?为什么我们要选择逻辑回归呢?又比如,很多文章中都用到的关于房屋价格的回归问题时,我们可能也会很快就想到最小二乘法,同样,这又是怎么得来的呢?这里,我将给出一些非常漂亮的理由。同时,同样的方法也可以用在其它类似的机器学习算法中的模型选择问题上。

为了后面描述方便,我们首先简单回顾一下指数分布簇的函数形式,

谈一下模型的选择

千万别被这个公式吓跑了,其实在这里,我们并不会去深究指数分布簇各个参数的意义,暂且只需要知道有这回事就ok了。因为我们介绍它只是为了引出广义线性模型的定义,因为我们前面所提到的逻辑回归,最小二乘等,都属于广义线性模型中的一个特例。所以,通过广线性模型来最终引出为什么我们在解决这类问题时选择这两个模型,并且得出类似问题的解决方法,应该是比较合理的。广义线性模型(GLM)定义为需要满足如下三个条件:

读书人网 >互联网

热点推荐