Bio.Align.maf 模块

Bio.Align 对“maf”多重比对格式的支持。

由 UCSC 描述的多重比对格式,将一系列多重比对存储在一个文件中。它适用于全基因组到全基因组的比对,可以存储元数据,如源染色体、起始位置、大小和链。

参见 http://genome.ucsc.edu/FAQ/FAQformat.html#format5

您应该通过 Bio.Align 函数使用此模块。

MAF 格式中的坐标是根据从零开始的起始位置(类似于 Python)和比对区域大小定义的。

源序列中长度为 1 且起始位置为第一个位置的最小比对区域将具有 start == 0size == 1

正如我们在这个例子中看到的,start + size 将比从零开始的结束位置多 1。因此,我们可以像 Python 列表切片边界一样操作 startstart + size

class Bio.Align.maf.AlignmentWriter(target)

基类: AlignmentWriter

接受 Alignment 对象,写入 MAF 文件。

fmt: str | None = 'MAF'
write_header(stream, alignments)

写入 MAF 头。

format_alignment(alignment)

返回一个字符串,其中包含单个比对,格式化为 MAF 块。

__abstractmethods__ = frozenset({})
class Bio.Align.maf.AlignmentIterator(source)

基类: AlignmentIterator

用于多个比对格式文件的比对迭代器。

文件可能包含多个连接的比对,这些比对会以增量方式加载和返回。

文件元数据存储在返回的迭代器的 .metadata 属性中。比对注释存储在 Alignment 对象的 .annotations 属性中,除了比对分数,它存储为一个属性。比对块中空部分的序列信息(将前一个比对块连接到下一个比对块的序列,但不与当前比对块比对)存储在比对注释的 "empty" 键下。与比对中每一行相关的注释存储在相应序列记录的 .annotations 属性中。

fmt: str | None = 'MAF'
status_characters = ('C', 'I', 'N', 'n', 'M', 'T')
empty_status_characters = ('C', 'I', 'M', 'n')
__abstractmethods__ = frozenset({})