Bio.GenBank 包

子模块

模块内容

用于处理 GenBank 格式文件的代码。

现在鼓励您使用 Bio.SeqIO 而不是 Bio.GenBank,使用“genbank”或“embl”格式名称将 GenBank 或 EMBL 文件解析为 SeqRecord 和 SeqFeature 对象(有关详细信息,请参阅 Biopython 教程)。

直接使用 Bio.GenBank 解析 GenBank 文件仅在您想要获取特定于 GenBank 的 Record 对象时才有用,这比 FeatureParser(在 Bio.SeqIO 中使用)中的 SeqRecord 替代方案更接近原始文件内容。

要使用 Bio.GenBank 解析器,有两个辅助函数

  • read 将包含单个 GenBank 记录的句柄解析为 Bio.GenBank 特定的 Record 对象。

  • parse 迭代包含多个 GenBank 记录的句柄作为 Bio.GenBank 特定的 Record 对象。

以下内部类不适用于直接使用,并且可能在将来的版本中被弃用。

  • Iterator 逐个迭代 GenBank 条目的文件

  • FeatureParser 将 GenBank 数据解析为 SeqRecord 和 SeqFeature 对象。

  • RecordParser 将 GenBank 数据解析为 Record 对象。

异常
  • ParserFailureError 指示解析器(即扫描器或使用者)中出现错误的异常

class Bio.GenBank.Iterator(handle, parser=None)

基类:object

Iterator 接口,用于一次迭代 GenBank 条目的文件(已过时)。

此类可能会在 Biopython 的未来版本中被弃用。请改用 Bio.SeqIO.parse(…, format=”gb”) 或 Bio.GenBank.parse(…) 分别获取 SeqRecord 和特定于 GenBank 的 Record 对象。

__init__(handle, parser=None)

初始化迭代器。

参数
  • handle - 包含要迭代的 GenBank 条目的句柄。

  • parser - 一个可选的解析器,在返回条目之前将条目传递给它。如果为 None,则将返回原始条目。

__next__()

从句柄中返回下一个 GenBank 记录。

如果我们用完了记录,则返回 None。

__iter__()

迭代记录。

exception Bio.GenBank.ParserFailureError

基类:ValueError

由解析器中的某些问题引起的错误。

class Bio.GenBank.FeatureParser(debug_level=0, use_fuzziness=1, feature_cleaner=None)

基类:object

将 GenBank 文件解析为 Seq + Feature 对象(已过时)。

不建议直接使用此类,并且可能在 Biopython 的未来版本中被弃用。

请改用 Bio.SeqIO.parse(…) 或 Bio.SeqIO.read(…)。

__init__(debug_level=0, use_fuzziness=1, feature_cleaner=None)

初始化 GenBank 解析器和 Feature 使用者。

参数
  • debug_level - 一个可选参数,它指定解析器应输出的调试信息量。默认情况下,我们没有调试信息(最快的执行方式),但如果需要,可以将其设置为 2,并查看解析失败的确切位置。

  • use_fuzziness - 指定是否使用模糊表示。默认值为 1(使用模糊性)。

  • feature_cleaner - 用于清理特征值的类。此类必须实现 clean_value 函数。GenBank.utils 有一个“标准”清理器类,它被默认使用。

parse(handle)

解析指定的句柄。

class Bio.GenBank.RecordParser(debug_level=0)

基类:object

将 GenBank 文件解析为 Record 对象(已过时)。

不建议直接使用此类,并且可能在 Biopython 的未来版本中被弃用。

请改用 Bio.GenBank.parse(…) 或 Bio.GenBank.read(…) 函数。

__init__(debug_level=0)

初始化解析器。

参数
  • debug_level - 一个可选参数,它指定解析器应输出的调试信息量。默认情况下,我们没有调试信息(最快的执行方式),但如果需要,可以将其设置为 2,并查看解析失败的确切位置。

parse(handle)

将指定的句柄解析为 GenBank 记录。

Bio.GenBank.parse(handle)

迭代 GenBank 格式的条目作为 Record 对象。

>>> from Bio import GenBank
>>> with open("GenBank/NC_000932.gb") as handle:
...     for record in GenBank.parse(handle):
...         print(record.accession)
['NC_000932']

要获取 SeqRecord 对象,请改用 Bio.SeqIO.parse(…, format=”gb”)。

Bio.GenBank.read(handle)

将包含单个 GenBank 条目的句柄读取为 Record 对象。

>>> from Bio import GenBank
>>> with open("GenBank/NC_000932.gb") as handle:
...     record = GenBank.read(handle)
...     print(record.accession)
['NC_000932']

要获取 SeqRecord 对象,请改用 Bio.SeqIO.read(…, format=”gb”)。