Bio.NaiveBayes 模块

通用朴素贝叶斯学习器(已弃用)。

朴素贝叶斯是一种监督分类算法,它使用贝叶斯定理来计算新观察值与一些先前观察到的数据之间的拟合度。观察值是离散特征向量,其中贝叶斯假设特征是独立的。尽管这几乎从不成立,但该分类器在实践中仍然足够有效。

术语表
  • 观察值 - 离散数据的特征向量。

  • 类别 - 观察值可能的分类。

  • NaiveBayes - 保存朴素贝叶斯分类器的信息。

函数
  • train - 训练新的朴素贝叶斯分类器。

  • calculate - 计算给定观察值时每个类别的概率。

  • classify - 将观察值分类到某个类别。

class Bio.NaiveBayes.NaiveBayes

基类:object

保存朴素贝叶斯分类器的信息。

属性
  • classes - 数据可能的类别列表。

  • p_conditional - 类别 x 维度数组,包含值 -> P(value|class,dim) 的字典。

  • p_prior - 每个类别的先验概率列表。

  • dimensionality - 数据的维度。

__init__()

初始化类。

Bio.NaiveBayes.calculate(nb, observation, scale=False)

计算每个类别的对数条件概率。

参数
  • nb - 已训练的朴素贝叶斯分类器。

  • observation - 表示观察数据的列表。

  • scale - 布尔值,指示是否应按 P(observation) 缩放概率。默认情况下,不进行缩放。

返回一个字典,其中键是类别,值是类别的对数概率。

Bio.NaiveBayes.classify(nb, observation)

将观察值分类到某个类别。

Bio.NaiveBayes.train(training_set, results, priors=None, typecode=None)

在训练集上训练朴素贝叶斯分类器。

参数
  • training_set - 观察值列表。

  • results - 每个观察值的类别分配列表。因此,training_set 和 results 必须具有相同的长度。

  • priors - 可选字典,指定每种结果类型的先验概率。如果未指定,则先验概率将根据训练结果估算。