从事K12教育行业多年
贝叶斯统计的应用:机器学习,模式识别。
贝叶斯统计方法被广泛应用于统计学、计算机科学、模式识别、计算机视觉、信号处理、机器学习等多个领域,是一种基于概率论的可解释性分析方法。
英国学者托马斯·贝叶斯在《论有关机遇问题的求解》中提出一种归纳推理的理论,后被一些统计学者发展为一种系统的统计推断方法,称为贝叶斯方法。采用这种方法作统计推断所得的全部结果,构成贝叶斯统计的内容。
认为贝叶斯方法是唯一合理的统计推断方法的统计学者,组成数理统计学中的贝叶斯学派,其形成可追溯到20世纪30年代。到50~60年代,已发展为一个有影响的学派。其影响日益扩大。
贝叶斯学派与频率学派争论的焦点在于先验分布的问题。所谓频率学派是指坚持概率的频率解释的统计学家形成的学派。贝叶斯学派认为先验分布可以是主观的,它没有也不需要有频率解释。
而频率学派则认为,只有在先验分布有一种不依赖主观的意义,且能根据适当的理论或以往的经验决定时,才允许在统计推断中使用先验分布,否则就会丧失客观性。
另一个批评是:贝叶斯方法对任何统计问题都给以一种程式化的解法,这导致人们对问题不去作深入分析,而只是机械地套用公式。
贝叶斯学派则认为:从理论上说,可以在一定条件下证明,任何合理的优良性准则必然是相应于一定先验分布的贝叶斯准则,所以每个统计学家自觉或不自觉地都是“贝叶斯主义者”。他们认为频率学派表面上不使用先验分布,但所得到的解也还是某种先验分布下的贝叶斯解。
而这一潜在的先验分布,可能比经过慎重选定的主观先验分布更不合理。其次贝叶斯学派还认为,贝叶斯方法对统计推断和决策问题给出程式化的解是优点而非缺点,因为它免除了寻求抽样分布,(见统计量)这个困难的数学问题。
而且这种程式化的解法并不是机械地套公式,它要求人们对先验分布、损失函数等的选择作大量的工作。还有贝叶斯学派认为,用贝叶斯方法求出的解不需要频率解释,因而即使在一次使用下也有意义。
反之根据概率的频率解释而提供的解,则只有在大量次数使用之下才有意义,而这常常不符合应用的实际。这两个学派的争论是战后数理统计学发展中的一个特色。这个争论还远没有解决,它对今后数理统计学的发展还将产生影响。