贝叶斯分类器

简介

贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。一种常用策略是先假定其具有某种确定的概率分布形式,再基于训练样本对概率分布的参数进行估计。

贝叶斯准则: 贝叶斯准则

从公式中可知,如果要计算X条件下Y发生的概率,只需要计算出后面等式的三个部分

对于朴素贝叶斯分类器,朴素(naive)的含义是各个特征属性之间是相互独立的。

(wi表示各个特征属性分量)

朴素贝叶斯分类器的训练过程就是基于训练集D来估计类先验概率P(c),并为每个特征属性估计条件概率P(wi|c)。对于类先验概率,在有足够独立同分布训练样本的条件下,通过计算各类样本占总样本数的比例来计算。