Bio.Align.sam 模块
Bio.Align 对“sam”成对比对格式的支持。
序列比对/映射 (SAM) 格式由 Wellcome Trust Sanger 研究所的 Heng Li 和 Richard Durbin 创建,用于在一个文件中存储一系列对基因组的比对。通常它们用于下一代测序数据。SAM 文件存储已映射序列的比对位置,并且还可以存储比对序列以及与序列相关的其他信息。
有关更多信息,请参阅 http://www.htslib.org/。
您应该通过 Bio.Align 函数使用此模块。
SAM 格式中的坐标定义为以 1 为基准的起始位置;解析器将这些坐标转换为以 0 为基准的坐标,以与 Python 和其他比对格式保持一致。
- class Bio.Align.sam.AlignmentWriter(target, md=False)
-
用于序列比对/映射 (SAM) 文件格式的比对文件写入器。
- fmt: str | None = 'SAM'
- __init__(target, md=False)
创建一个 AlignmentWriter 对象。
- 参数
- md - 如果为 True,则从比对中计算 MD 标记并将其包含在
输出中。如果为 False(默认值),则不要将 MD 标记包含在输出中。
- write_header(stream, alignments)
写入 SAM 标头。
- format_alignment(alignment, md=None)
返回一个字符串,其中包含一个格式化为 SAM 单行的比对。
- __abstractmethods__ = frozenset({})
- class Bio.Align.sam.AlignmentIterator(source)
-
用于序列比对/映射 (SAM) 文件的比对迭代器。
文件中的每一行包含一个基因组比对,这些比对会加载并按增量返回。以下列将作为比对的属性存储
flag:FLAG 位掩码组合;
mapq:映射质量(仅在可用时存储)
- rnext:下一个读的初级比对的参考序列名称
在比对中(仅在可用时存储)
- pnext:下一个读的初级比对在模板中的以 0 为基准的位置
(仅在可用时存储)
tlen:观察到的带符号模板长度(仅在可用时存储)
通过其标记与比对相关的其他信息存储在每个比对的注释属性中。
任何硬剪切(剪切的序列不在查询序列中)都存储为查询序列记录的注释字典属性中的‘hard_clip_left’和‘hard_clip_right’。
如果可用,序列质量将存储为查询序列记录的letter_annotations字典属性中的‘phred_quality’。
- fmt: str | None = 'SAM'
- __abstractmethods__ = frozenset({})