高维空间存在可分的情况。
我们可以找一个映射函数送过去。
高维空间的内积可以通过低维空间的内积表示。
这样的表示方法即为核函数。
也就是说,只要知道核函数,就知道高维空间的内积。
Kernel Methods起作用,通过:
如果映射选择合适,复杂的关系能够被简化。
另外,我们观察得到:
一个函数:k:X×X→Rk:X\times X\to Rk:X×X→R
满足有限正半定当且仅当对于有限个样本xxx,它的内积矩阵是一个正半定矩阵。
另外,思考4和5对应定理:Characterization of Kernels。
K(x,z)=x⋅zK(x,z)=x\cdot zK(x,z)=x⋅z
什么时候用:特征比较丰富,样本数据量大,需要进行实时得出结果的问题。
优点:简单,不需要设置任何参数,可以直接使用。
K(x,z)=(γx⋅z+ζ)p,γ>0K(x,z)=(\gamma x\cdot z+\zeta)^p,\gamma\gt0K(x,z)=(γx⋅z+ζ)p,γ>0
γ\gammaγ对内积进行放缩、ζ\zetaζ控制常数项、qqq控制高次项。
维度和阶没有必然关系,只是特征空间核原空间的映射关系的体现。
K(x,z)=exp(−∥x−z∥22σ2)K(x,z)=\exp(-\frac{\|x-z\|^2}{2\sigma^2})K(x,z)=exp(−2σ2∥x−z∥2)
表示什么:两个样本点之间相似的程度(欧氏距离)。
上述式子在凑两个样本点的内积表示。
高斯核函数可以表示为无穷维度的特征。
其他样本点和当前样本点的高斯核函数结果作为当前样本点的特征。
就是说: