Bio.Align.bigmaf 模块

Bio.Align 对 “bigmaf” 多重比对格式的支持。

bigMaf 格式以与 MAF(多重比对格式)格式兼容的格式存储多重比对。BigMaf 文件是二进制文件,并被索引为 bigBed 文件。

参见 https://genome.ucsc.edu/goldenPath/help/bigMaf.html

class Bio.Align.bigmaf.AlignmentWriter(target, targets=None, compress=True, blockSize=256, itemsPerSlot=512)

Bases: AlignmentWriter

bigMaf 文件格式的对齐文件写入器。

fmt: str | None = 'bigMaf'
__init__(target, targets=None, compress=True, blockSize=256, itemsPerSlot=512)

创建一个 AlignmentWriter 对象。

参数
  • target - 输出流或文件名。

  • targets - 一个 SeqRecord 对象列表,其中包含染色体,

    顺序与它们出现在比对中的顺序一致。每个 SeqRecord 中的序列内容可能是未定义的,但序列长度必须定义,例如

    SeqRecord(Seq(None, length=248956422), id=”chr1”)

    如果 targets 为 None(默认值),则比对必须具有一个属性 .targets,提供 SeqRecord 对象列表。

  • compress - 如果为 True(默认值),则使用 zlib 压缩数据。

    如果为 False,则不压缩数据。将 compress 设置为 False 可用于更快的搜索。

  • blockSize - 要在 r-tree 中捆绑的项目数量。

    有关更多信息,请参阅 UCSC 的 bedToBigBed 程序。默认值为 256。

  • itemsPerSlot - 在最低级别捆绑的数据点数量。

    有关更多信息,请参阅 UCSC 的 bedToBigBed 程序。将 itemsPerSlot 设置为 1 可用于更快的搜索。默认值为 512。

write_file(stream, alignments)

写入文件。

__abstractmethods__ = frozenset({})
class Bio.Align.bigmaf.AlignmentIterator(source)

Bases: AlignmentIterator, AlignmentIterator

bigMaf 文件的对齐迭代器。

该文件可能包含多个比对,这些比对将被增量加载并返回。

比对注释存储在 .annotations 属性中,该属性属于 Alignment 对象,除了比对得分,它存储为一个属性。对齐块中空部分(连接前一个对齐块到下一个对齐块,但未对齐到当前对齐块的序列)的序列信息存储在对齐注释中的 "empty" 键下。特定于对齐中每行的注释存储在相应序列记录的 .annotations 属性中。

fmt: str | None = 'bigMaf'
mode = 'b'
__init__(source)

创建一个 AlignmentIterator 对象。

参数: - source - 输入文件流或输入文件路径

__abstractmethods__ = frozenset({})