Bio.Align.sam 模块

Bio.Align 对“sam”成对比对格式的支持。

序列比对/映射 (SAM) 格式由 Wellcome Trust Sanger 研究所的 Heng Li 和 Richard Durbin 创建,用于在一个文件中存储一系列对基因组的比对。通常它们用于下一代测序数据。SAM 文件存储已映射序列的比对位置,并且还可以存储比对序列以及与序列相关的其他信息。

有关更多信息,请参阅 http://www.htslib.org/

您应该通过 Bio.Align 函数使用此模块。

SAM 格式中的坐标定义为以 1 为基准的起始位置;解析器将这些坐标转换为以 0 为基准的坐标,以与 Python 和其他比对格式保持一致。

class Bio.Align.sam.AlignmentWriter(target, md=False)

基类:AlignmentWriter

用于序列比对/映射 (SAM) 文件格式的比对文件写入器。

fmt: str | None = 'SAM'
__init__(target, md=False)

创建一个 AlignmentWriter 对象。

参数
  • md - 如果为 True,则从比对中计算 MD 标记并将其包含在

    输出中。如果为 False(默认值),则不要将 MD 标记包含在输出中。

write_header(stream, alignments)

写入 SAM 标头。

format_alignment(alignment, md=None)

返回一个字符串,其中包含一个格式化为 SAM 单行的比对。

__abstractmethods__ = frozenset({})
class Bio.Align.sam.AlignmentIterator(source)

基类:AlignmentIterator

用于序列比对/映射 (SAM) 文件的比对迭代器。

文件中的每一行包含一个基因组比对,这些比对会加载并按增量返回。以下列将作为比对的属性存储

  • flag:FLAG 位掩码组合;

  • mapq:映射质量(仅在可用时存储)

  • rnext:下一个读的初级比对的参考序列名称

    在比对中(仅在可用时存储)

  • pnext:下一个读的初级比对在模板中的以 0 为基准的位置

    (仅在可用时存储)

  • tlen:观察到的带符号模板长度(仅在可用时存储)

通过其标记与比对相关的其他信息存储在每个比对的注释属性中。

任何硬剪切(剪切的序列不在查询序列中)都存储为查询序列记录的注释字典属性中的‘hard_clip_left’和‘hard_clip_right’。

如果可用,序列质量将存储为查询序列记录的letter_annotations字典属性中的‘phred_quality’。

fmt: str | None = 'SAM'
__abstractmethods__ = frozenset({})