SVM向量机初入门

SVM向量机

使用SVM向量机将数据进行区分。

由于markdown中不方便插入图片,所以就略去不谈,示意的图片可以在网上找到很多。

总的来讲,通过SVM向量机对数据进行处理,训练模型,然后通过模型去推测更多的数据。

也就是我下面所说的那个分类与预测

最直接的做法就是:最接近的两个元素之间的距离,不同的两个元素之中会有不同的距离,找出最大的那一个距离,使得你的区分线鲁棒性最强。

由于我们整个SVM向量机都是一个预测的使用目的,你的区分模型鲁棒性越强,那么后续的预测就会更加准确。

与此同时,还需要注意一个过拟合的问题:

  • 这个可以用线性回归模型来进行演示,在平面上的那么多个点,划出一条直线,那么这一条直线是不可能都刚好通过所有的点的,假如说真的有那么一条直线通过所有的点,那么说明问题大了,为了通过所有的点,往往就付出了准确性下降,无法正确预测后面的点的代价,这个就是过拟合。

  • 一般情况下,预测的正确性能够有80%-90%就挺不错的了,太高就会发生过拟合问题,太低那就是预测不准。

现在研究完了SVM向量机,那么它是如何快速处理那么多的数据的呢?

这必须要用到加速处理。

将低维非线性升为高维线性函数

高维线性函数可以使用线性回归方程求解,进而优化计算速度。