SVM VS. Logistic Regression

taogeshare • 2020年5月19日 • 发表评论

二者都是经典的分类器，SVM更强调最优化的可分，并且有严密的数学模型支撑。
网上搜了二者的优缺点对比，最终说实话还是一知半解。可能还需要真实场景实践，也许能够深入理解二者区别吧。

支持向量机的优势在于:

在高维空间中非常高效.
在线性可分的低维空间，SVM得到的比Logistic Regression更加健壮
即使在数据维度比样本数量大的情况下仍然有效.
在决策函数（称为支持向量）中使用训练集的子集,因此它也是高效利用内存的.
通用性: 不同的核函数与特定的决策函数一一对应.常见的内核已经提供,也可以指定定制的内核.

支持向量机的缺点包括:

如果特征数量比样本数量大得多,在选择核函数时要避免过拟合,而且正则化项是非常重要的.
支持向量机不直接提供概率估计,这些都是使用昂贵的五次交叉验算计算的.

支持向量机 VS. Logistic Regression Intuition

原始数据集：X1、X2、Y
通过SVM Linear和SMO算法得到最优化边界（蓝色），和对应的w、b
通过Logistic Regression得到w和b
画出两种情况下的decision boundary，明显看到SVM更加robust，泛化能力更好。这是对于线性硬可分的支持向量机来看，如果是线性不可分或者更复杂的场景，也许结果有可能不同。

暂无评论

发表回复取消回复

虚拟化 | 云计算 | 机器学习 | 股市复盘 © 2024 涛哥，版权所有, 京ICP备20014492-2号