Bio.Align.maf 模块
Bio.Align 对“maf”多重比对格式的支持。
由 UCSC 描述的多重比对格式,将一系列多重比对存储在一个文件中。它适用于全基因组到全基因组的比对,可以存储元数据,如源染色体、起始位置、大小和链。
参见 http://genome.ucsc.edu/FAQ/FAQformat.html#format5
您应该通过 Bio.Align 函数使用此模块。
MAF 格式中的坐标是根据从零开始的起始位置(类似于 Python)和比对区域大小定义的。
源序列中长度为 1 且起始位置为第一个位置的最小比对区域将具有 start == 0
和 size == 1
。
正如我们在这个例子中看到的,start + size
将比从零开始的结束位置多 1。因此,我们可以像 Python 列表切片边界一样操作 start
和 start + size
。
- class Bio.Align.maf.AlignmentWriter(target)
基类:
AlignmentWriter
接受 Alignment 对象,写入 MAF 文件。
- fmt: str | None = 'MAF'
- write_header(stream, alignments)
写入 MAF 头。
- format_alignment(alignment)
返回一个字符串,其中包含单个比对,格式化为 MAF 块。
- __abstractmethods__ = frozenset({})
- class Bio.Align.maf.AlignmentIterator(source)
-
用于多个比对格式文件的比对迭代器。
文件可能包含多个连接的比对,这些比对会以增量方式加载和返回。
文件元数据存储在返回的迭代器的
.metadata
属性中。比对注释存储在Alignment
对象的.annotations
属性中,除了比对分数,它存储为一个属性。比对块中空部分的序列信息(将前一个比对块连接到下一个比对块的序列,但不与当前比对块比对)存储在比对注释的"empty"
键下。与比对中每一行相关的注释存储在相应序列记录的.annotations
属性中。- fmt: str | None = 'MAF'
- status_characters = ('C', 'I', 'N', 'n', 'M', 'T')
- empty_status_characters = ('C', 'I', 'M', 'n')
- __abstractmethods__ = frozenset({})