2022年 11月 8日

【python】SVM算法介绍

支持向量机(support vector machines,SVM)是一种二分类模型,它将实例的特征向量映射为空间中的一些点,SVM的目的就是想要画出一条线,以“最好地”区分这两类点,以至如果以后有了新的点,这条线也能做出很好的分类。SVM适合中小型数据样本、非线性、高维的分类问题。

SVM最早是由Vladimir N. vapnik和Alexey ‘Ya.Chervonenkis在1963年提出,目前的版本(soft margin)是由Corinna Cortes和Vapnik在1993年提出,并在1995年发表。深度学习(2012)出现之前,SVM被认为机器学习中近十几年来最成功,表现最好的算法。

1.1 SVM基本概念

将实例的特征向量(以二维为例)映射为空间中的一些点,如下图的实心点和空心点,它们属于不同的两类。SVM的目的就是想要画出一条线,以“最好地”区分这两类点,以至如果以后有了新的点,这条线也能做出很好的分类。

1.2 hard-margin SVM 

 

 

 

2.实例演示

2.1基于sklearn包实现通过svm算法绘图的功能

  1. from sklearn import svm
  2. import numpy as np
  3. import matplotlib.pyplot as plt
  4. #准备训练样本
  5. x=[[1,8],[3,20],[1,15],[3,35],[5,35],[4,40],[7,80],[6,49]]
  6. y=[1,1,-1,-1,1,-1,-1,1]
  7. ##开始训练
  8. clf=svm.SVC() ##默认参数:kernel='rbf'
  9. clf.fit(x,y)
  10. #print("预测...")
  11. #res=clf.predict([[2,2]]) ##两个方括号表面传入的参数是矩阵而不是list
  12. ##根据训练出的模型绘制样本点
  13. for i in x:
  14. res=clf.predict(np.array(i).reshape(1, -1))
  15. if res > 0:
  16. plt.scatter(i[0],i[1],c='r',marker='*')
  17. else :
  18. plt.scatter(i[0],i[1],c='g',marker='*')
  19. ##生成随机实验数据(15行2列)
  20. rdm_arr=np.random.randint(1, 15, size=(15,2))
  21. ##回执实验数据点
  22. for i in rdm_arr:
  23. res=clf.predict(np.array(i).reshape(1, -1))
  24. if res > 0:
  25. plt.scatter(i[0],i[1],c='r',marker='.')
  26. else :
  27. plt.scatter(i[0],i[1],c='g',marker='.')
  28. ##显示绘图结果
  29. plt.show()

2.2 核函数的实现

 

  1. from sklearn import svm
  2. import numpy as np
  3. import matplotlib.pyplot as plt
  4. ##设置子图数量
  5. fig, axes = plt.subplots(nrows=2, ncols=2,figsize=(7,7))
  6. ax0, ax1, ax2, ax3 = axes.flatten()
  7. #准备训练样本
  8. x=[[1,8],[3,20],[1,15],[3,35],[5,35],[4,40],[7,80],[6,49]]
  9. y=[1,1,-1,-1,1,-1,-1,1]
  10. '''
  11. 说明1:
  12. 核函数(这里简单介绍了sklearn中svm的四个核函数,还有precomputed及自定义的)
  13. LinearSVC:主要用于线性可分的情形。参数少,速度快,对于一般数据,分类效果已经很理想
  14. RBF:主要用于线性不可分的情形。参数多,分类结果非常依赖于参数
  15. polynomial:多项式函数,degree 表示多项式的程度-----支持非线性分类
  16. Sigmoid:在生物学中常见的S型的函数,也称为S型生长曲线
  17. 说明2:根据设置的参数不同,得出的分类结果及显示结果也会不同
  18. '''
  19. ##设置子图的标题
  20. titles = ['LinearSVC (linear kernel)',
  21. 'SVC with polynomial (degree 3) kernel',
  22. 'SVC with RBF kernel', ##这个是默认的
  23. 'SVC with Sigmoid kernel']
  24. ##生成随机试验数据(15行2列)
  25. rdm_arr=np.random.randint(1, 15, size=(15,2))
  26. def drawPoint(ax,clf,tn):
  27. ##绘制样本点
  28. for i in x:
  29. ax.set_title(titles[tn])
  30. res=clf.predict(np.array(i).reshape(1, -1))
  31. if res > 0:
  32. ax.scatter(i[0],i[1],c='r',marker='*')
  33. else :
  34. ax.scatter(i[0],i[1],c='g',marker='*')
  35. ##绘制实验点
  36. for i in rdm_arr:
  37. res=clf.predict(np.array(i).reshape(1, -1))
  38. if res > 0:
  39. ax.scatter(i[0],i[1],c='r',marker='.')
  40. else :
  41. ax.scatter(i[0],i[1],c='g',marker='.')
  42. if __name__=="__main__":
  43. ##选择核函数
  44. for n in range(0,4):
  45. if n==0:
  46. clf = svm.SVC(kernel='linear').fit(x, y)
  47. drawPoint(ax0,clf,0)
  48. elif n==1:
  49. clf = svm.SVC(kernel='poly', degree=3).fit(x, y)
  50. drawPoint(ax1,clf,1)
  51. elif n==2:
  52. clf= svm.SVC(kernel='rbf').fit(x, y)
  53. drawPoint(ax2,clf,2)
  54. else :
  55. clf= svm.SVC(kernel='sigmoid').fit(x, y)
  56. drawPoint(ax3,clf,3)
  57. plt.show()

2.3 线性分类函数:LinearSVC()

  1. from sklearn import svm
  2. import numpy as np
  3. import matplotlib.pyplot as plt
  4. ##设置子图数量
  5. fig, axes = plt.subplots(nrows=1, ncols=2,figsize=(7,7))
  6. ax0, ax1 = axes.flatten()
  7. #准备训练样本
  8. x=[[1,8],[3,20],[1,15],[3,35],[5,35],[4,40],[7,80],[6,49]]
  9. y=[1,1,-1,-1,1,-1,-1,1]
  10. ##设置子图的标题
  11. titles = ['SVC (linear kernel)',
  12. 'LinearSVC']
  13. ##生成随机试验数据(15行2列)
  14. rdm_arr=np.random.randint(1, 15, size=(15,2))
  15. ##画图函数
  16. def drawPoint(ax,clf,tn):
  17. ##绘制样本点
  18. for i in x:
  19. ax.set_title(titles[tn])
  20. res=clf.predict(np.array(i).reshape(1, -1))
  21. if res > 0:
  22. ax.scatter(i[0],i[1],c='r',marker='*')
  23. else :
  24. ax.scatter(i[0],i[1],c='g',marker='*')
  25. ##绘制实验点
  26. for i in rdm_arr:
  27. res=clf.predict(np.array(i).reshape(1, -1))
  28. if res > 0:
  29. ax.scatter(i[0],i[1],c='r',marker='.')
  30. else :
  31. ax.scatter(i[0],i[1],c='g',marker='.')
  32. if __name__=="__main__":
  33. ##选择核函数
  34. for n in range(0,2):
  35. if n==0:
  36. clf = svm.SVC(kernel='linear').fit(x, y)
  37. drawPoint(ax0,clf,0)
  38. else :
  39. clf= svm.LinearSVC().fit(x, y)
  40. drawPoint(ax1,clf,1)
  41. plt.show()

借鉴https://www.cnblogs.com/lc1217/p/6639448.html